PacBio heeft een nieuwe informaticamethode aangekondigd die genparalogen en pseudogenen met hoge nauwkeurigheid genotypeert. De nieuwe computationele tool, genaamd "Paraphase", maakt het mogelijk varianten aan te roepen, kopiegetalanalyses uit te voeren en te faseren door de volledige gensequentie van elk van de haplotypes voor alle genen en pseudogenen van dezelfde genfamilie te identificeren. Veel medisch relevante genen vallen onder segmentaire duplicaties en hebben dus sterk gelijkende genfamilieleden of pseudogenen.

De sequentieovereenkomst leidt vaak tot foutgevoelige read alignment en variant calling. Paraphase is gebruikt voor verschillende medisch relevante genen met sterk gelijkende paralogen of pseudogenen, waaronder CYP21A2 (21-hydroxylase-deficiënte congenitale bijnierhyperplasie), TNXB (Ehlers-Danlos syndroom), STRC (erfelijk gehoorverlies en doofheid) en SMN1 en 2 (spinale musculaire atrofie). SMN1 is >99,9% gelijk in sequentie met zijn paraloog, SMN2, en beide genen hebben variabele aantallen kopieën in populaties.

Mutaties in SMN1 veroorzaken spinale musculaire atrofie (SMA), een belangrijke oorzaak van vroege kindersterfte. Gedetailleerde high throughput sequentieanalyse van complete genen is een uitdaging met de bestaande technologieën, en het identificeren van stille dragers (met twee kopieën van SMN1 op het ene chromosoom en nul kopieën op het andere, goed voor 27 procent van de dragers in Afrikaanse populaties) is onmogelijk zonder stamboominformatie. In een recente peer-reviewed publicatie was Paraphase in staat om deze pathogene varianten voor SMA te detecteren.

De studie identificeerde ook belangrijke SMN1 en SMN2 haplogroepen en karakteriseerde hun co-segregatie door middel van stamboomanalyses. Bovendien identificeerden de auteurs een paar haplotypes die kunnen dienen als een genetische marker voor allelen die twee kopieën van SMN1 dragen in Afrikaanse populaties, wat het potentieel aantoont van op haplotypes gebaseerde screening van stille dragers.