A gyorstesztek pontossága - avagy a szemfényvesztés 3 arca
Az első szemfényvesztés a klinikai vizsgálatok elemszámából fakadó analitikai bizonytalanság
A teszteket összehasonlító vizsgálatok során érdemes nézni a klinikai vizsgálatok elemszámát, ez határozza meg a vizsgálat általánosíthatóságát. Nézzünk egy példát. Egy hazánkban elérhető nyálteszt hivatalosan 90,1%-os érzékenységű (CI 82,54%-95,15%), a BOSON orrtesztje pedig 96.77% (CI 94,04-98,29). Az ún. konfidencia intervallum (CI) kifejezi, hogy a becsült adat a valóságban milyen intervallum között ingadozhat, a magas klinikai vizsgálati elemszám logikusan kisebb statisztikai bizonytalansággal jár, ezért a konfidencia intervallum is szűkebb lesz, tehát biztosabbak lehetünk a teszt teljesítőképességében is.
A BOSON adatait például egy 1027 fős klinikai tanulmány (ezen belül 307 pozitív minta) támasztja alá. A gyári adatok szerint a BOSON antigén teszt konfidencia intervalluma alapján legrosszabb esetben is 94,04%-os az érzékenysége, a középértéke 96,77%. A nyáltesztet egy 406 fős vizsgálat során elemezték, amelyből 101 volt a pozitív minta. A teszt tényleges érzékenysége a konfidencia intervallum alapján akár 82,54% is lehet, míg a használati útmutatóban 90,1%-os középérték szerepel. Ha elfogadjuk a hivatalos klinikai vizsgálati adatokat, akkor a hazánkban forgalmazott patikai nyálteszt minden 100 vizsgált COVID-pozitív személyből 90-et mutat ki, tízet nem azonosít, a BOSON pedig 100 személyből 97-et mutat ki, és négy esetben tévedhet. Ez a 6% különbség valójában háromszoros eredményességi különbséget jelenthet, ilyen arányban lehet pontosabb az orrteszt, ha a sikertelenül vizsgált személyek számával mérjük az eredményességet (3 vs 10).
A második trükk a klinikai analitikai értékek megadásához kötődő víruskoncentráció mértéke
Nem mindegy, hogy a klinikai teszt során vizsgált személyek között milyen arányban szerepelnek magas, közepes és alacsony víruskoncentrációval rendelkező személyek. Ha a magas Ct értékekkel rendelkezők száma (ez alacsony víruskoncentrációt jelent) elenyésző, akkor magasabb lehet a teszt kimutatott érzékenysége. Ezért, ha hozzájutunk klinikai kíséreti adatokhoz, akkor mélyedjünk el a részletekben, vagy kérdezzünk utána a forgalmazóknál. Nézzünk egy példát. A BOSON antigén tesztjének klinikai tanulmányából például kiderül, hogy 27 Ct érték alatti vírusterhelés esetén a teszt szenzitivitása 100%, és csak 27-30 között kezd el tévedni a teszt, de akkor is még igen keveset, 30-33 Ct felett már ritkábban mutat ki vírusfertőzést., az azonban nem gond, mert 30-33 Ct érték felett már a kutatók többsége nem tartja fertőzőnek a vizsgált személyeket. Azaz a BOSON érzékenysége például magas a legfontosabb víruskoncentrációs tartományban. Vannak olyan tesztek, amelyek főleg 25 vagy 30 Ct alatti vizsgálati értékekre alapozva adják meg klinikai adataikat, azért ezek pontosabbnak tűnnek, de a gyakorlatban nem biztos, hogy azok, mert nem összemérhetőek azon tesztekkel, ahol jobban eloszlik az egyes minták víruskoncentráció csoportjainak (alacsony, közepes, magas) az aránya. Célszerű olyan cégeket is megkérdezni, akik már több teszttel is dolgoztak a múltban.
A harmadik trükk az összesített analitikai „pontosság” meghatározása.
A pontosság a szenzitivitási (valós pozitív eredmények) és specificitási (valós negatív eredmények) értékeinek súlyozott átlaga. Léteznek olyan tesztek, amelyeknek magasnak tűnő a pontossága, mondjuk 97-98% körüli. De ha elemezzük a statisztikai adatait, akkor kiderül, hogy ez azért van így, mert mondjuk egy 500 fős vizsgálati minta esetén, ha a teszt érzékenysége alacsony, 88%, de a fajlagossága, azaz a specificitása 99%, és utóbbit mondjuk magas mintaszámon, 440 negatív vizsgálati személlyel, míg előbbit 60 csak személlyel mérték, akkor a pontosság magas lesz. Amikor azonban veszély van, é s a fertőzési hullám közepén vagyunk, akkor a szenzitivitás válik fontossá, és ilyenkor csak magas érzékenységű termékeket érdemes használni, azaz a pontosság fogalma megtévesztő, mert papíron pontos a teszt, de a gyakorlatban 100 esetből 12-nél fals negatívot ad, mert a szenzitivitása gyenge.
Mindhárom trükk vonatkozhat az antitest és antigén tesztekre is. Azon cégeknek, amelyek többezer vagy több tízezer tesztet bonyolítottak le, és vannak PCR-rel összemért adataik, egzakt eredményeik lehetnek arról, hogy a használati útmutató és a valóság között milyen összefüggések vannak. Korábban az volt a szakmai konszenzus, hogy a tesztek általában gyengébb analitikai értékekre képesek, mint amit a használati útmutatóban található. Ma már az ellenkezőjére is van ellenpélda, a svájci LOMINA antitest tesztje például egy 1400 fős klinikai tanulmányt készíttetett Csehországban és az oltás utáni antitest szint mérés során az eszköz magasabb értékeket hozott, mint a vírusfertőzések után. Ennek persze lehetnek egyéb szakmai okai, de egy ilyen, nagy elemszámú mérési eredmény segítheti a vásárlói döntéseket is. A gond csak ott van, hogy ilyen információk nem mindig állnak rendelkezésre. A termékek jelentős részéről nincsenek független klinikai vizsgálati eredmények, így különös körültekintést igényel a megfelelő teszt eszköz kiválasztása.
A jó hír az, hogy igen sokat fejlődtek a gyorstesztek, és ma már 4-5 vagy akár több csúcsminőségű professzionális teszt is elérhető a piacon (Roche, Abbott, ACRO, NewGene, Siemens Clinitest), míg a lakossági termékek között is van már 1-2 kiemelkedő eszköz a patikákban és gyógyászati segédeszköz üzletekben, igaz, ezen a téren kisebb a választék (ld. BOSON antigén teszt és LOMINA antitest teszt).