Source code for alleleTools.format.tests.test_gene_report

from alleleTools.allele import AlleleParser
import pandas as pd
import pytest

from alleleTools.format.from_ikmb_hla import ConsensusGene

from ..gene_report import Gene, Report, remove_HLA_prefix
from ...plot.plot_ikmb_coverage import read_reports_asdf

parser = AlleleParser(gene_family="hla")


[docs]
def test_remove_HLA_prefix():
    cov = {"HLA-A": [1, 2], "HLA-B": [3, 4], "C": [5]}
    result = remove_HLA_prefix(cov)
    assert "A" in result
    assert "B" in result
    assert "C" in result
    assert "HLA-A" not in result
    assert result["A"] == [1, 2]




[docs]
def test_gene_mean_coverage():
    coverage = [{"exon": 1, "mean_cov": 10}, {"exon": 2, "mean_cov": 30}]
    calls = {"HLA-HD": ["A*01:01", "A*02:01"]}
    gene = Gene("A", calls, allele_parser=parser, coverage=coverage)
    assert gene.mean_coverage() == 20




[docs]
class TestGeneConsensus:

[docs]
    @pytest.fixture
    def coverage(self) -> list:
        return [{"exon": 1, "mean_cov": 10}, {"exon": 2, "mean_cov": 30}]



[docs]
    def test_similar_calls(self, coverage):
        calls = {
            "alg1": ["A*01:01", "A*02:01"],
            "alg2": ["A*01:01", "A*02:01"],
        }
        gene = ConsensusGene("A", calls, allele_parser=parser, coverage=coverage)
        alleles, support = gene.get_consensus_call(min_support=0.6)
        assert alleles == ['A*01:01', 'A*02:01']
        assert support == [2, 2]



[docs]
    def test_no_gene_name(self, coverage):
        """
        Depending on the version the IkMB reports might not have a gene name.
        """
        calls = {
            "alg1": ["01:01", "02:01"],
            "alg2": ["01:01", "02:01"],
        }
        gene = ConsensusGene("A", calls, allele_parser=parser, coverage=coverage)
        alleles, support = gene.get_consensus_call(min_support=0.6)
        assert alleles == ['A*01:01', 'A*02:01']
        assert support == [2, 2]





[docs]
def test_gene_asdict():
    coverage = [{"exon": 1, "mean_cov": 10}, {"exon": 2, "mean_cov": 30}]
    calls = {"HLA-HD": ["A*01:01", "A*02:01"]}

    gene = ConsensusGene("A", calls, allele_parser=parser, coverage=coverage)

    d = gene.consensus_dict(0.6)
    assert d["gene"] == "A"
    assert d["coverage"] == 20
    assert type(d["alleles"][0]) == str
    assert type(d["support"][0]) == int




[docs]
def test_report_aslist():
    report_dict = {
        "sample": "S1",
        "calls": {
            "A": {"HLA-HD": ["A*01:01", "A*02:01"]},
            "B": {"HLA-HD": ["B*07:02", "B*08:01"]},
        },
        "coverage": {
            "HLA-A": [{"exon": 1, "mean_cov": 10}, {"exon": 2, "mean_cov": 30}],
            "HLA-B": [{"exon": 1, "mean_cov": 40}, {"exon": 2, "mean_cov": 60}],
        },
    }
    report = Report(report_dict, allele_parser=parser)
    aslist = report.aslist()
    assert isinstance(aslist, list)
    assert aslist[0]["gene"] == "A"
    assert aslist[1]["gene"] == "B"
    assert aslist[0]["sample"] == "S1"
    assert aslist[1]["sample"] == "S1"




[docs]
def test_read_reports_asdf(tmp_path):
    # Prepare two fake json files
    data1 = {
        "sample": "S1",
        "calls": {"A": {"HLA-HD": ["A*01:01", "A*02:01"]}},
        "coverage": {
            "HLA-A": [{"exon": 1, "mean_cov": 10}, {"exon": 2, "mean_cov": 30}]
        },
    }
    data2 = {
        "sample": "S2",
        "calls": {"B": {"HLA-HD": ["B*07:02", "B*08:01"]}},
        "coverage": {
            "HLA-B": [{"exon": 1, "mean_cov": 40}, {"exon": 2, "mean_cov": 60}]
        },
    }
    file1 = tmp_path / "file1.json"
    file2 = tmp_path / "file2.json"
    file1.write_text(str(data1).replace("'", '"'))
    file2.write_text(str(data2).replace("'", '"'))
    df = read_reports_asdf([str(file1), str(file2)], allele_parser=parser)
    assert isinstance(df, pd.DataFrame)
    assert set(df["sample"]) == {"S1", "S2"}
    assert set(df["gene"]) == {"A", "B"}
    assert "coverage" in df.columns
    assert "coverage" in df.columns
    assert "coverage" in df.columns