Jak tęgie głowy i potężne komputery wykrywają wirusa brodawczaka ludzkiego
Istnieje ponad 200 rodzajów HPV. Zakażenia wirusem brodawczaka ludzkiego – human papillomavirus – występują często. Wiele z nich przebiega bezobjawowo. Niektóre są przyczyną łagodnych zmian skórnych, np. brodawek, inne mogą prowadzić do rozwoju groźnych dla zdrowia, a nawet życia nowotworów złośliwych. Dlatego ważne są badania DNA wirusa – analiza materiału genetycznego w kierunku HPV i dokładne określenie jego typu. To pozwala zapobiegać zmianom nowotworowym, a jeżeli już one wystąpią – wdrożyć odpowiednie leczenie.
HPV jest czynnikiem ryzyka rozwoju raka szyjki macicy. Przewlekłe zakażenie wirusami o tzw. wysokim potencjale rakotwórczym może prowadzić także do raka sromu, pochwy, odbytu, dolnego odcinka jelita grubego. Wiąże się z rakami jamy ustnej, gardła, krtani. Nowotwory wywołane HPV stanowią ponad 3% zachorowań na raka wśród kobiet i 2% wśród mężczyzn. W liczbach bezwzględnych to bardzo dużo, dlatego naukowcy dwoją się i troją nad metodą szybkiej identyfikacji obecności materiału genetycznego wirusa.

Przezwyciężyć trudności
Wśród badaczy, którzy pracują nad rozwiązaniem tego problemu, jest dr Marek Nowicki z Interdyscyplinarnego Centrum Modelowania Matematycznego i Komputerowego UW. Wraz ze współpracownikami opracował HPV-KITE – algorytm umożliwiający wykrywanie genotypów HPV z praktycznie dowolnych danych sekwencjonowania DNA.
– Wirusy rodziny HPV mają różną długość, mniej więcej 8000 nukleotydów, tzn. „znaków”. Całości praktycznie nie znajduje się w próbkach. Jak zostanie znalezionych odpowiednio dużo fragmentów, to możemy powiedzieć, że próbka jest pozytywna, tzn. zarażona wirusem – tłumaczy dr Nowicki.
Są trzy największe wyzwania w prawidłowym zidentyfikowaniu sekwencji genowych wirusów HPV. Po pierwsze wirus ten to tak naprawdę wielka rodzina ponad setki kuzynów. Jak to z blisko spokrewnionymi bywa – podobni (genotypowo), ale jednak trochę różni. I właśnie te różnice piętrzą trudności w prawidłowej identyfikacji. Po drugie w pobieranych próbkach znajdują się znaczne ilości DNA niewirusowego, to zwiększa zbiór do sprawdzenia, a co za tym idzie – czas poświęcony na poszukiwania. Wreszcie sam wirus wykazuje dużą zmienność i błyskawicznie mutuje. Algorytm autorstwa badaczy z ICM radzi sobie ze wszystkimi tymi trudnościami zaskakująco dobrze.
Pomysł + moc obliczeniowa = sukces
Metoda oparta jest na analizie k-merów – „wyrazów” o długości k, złożonych z liter A, C, T, G – symboli nukleotydów, z których składa się DNA. To, czy badany wyraz jest jakąś wersją ciągu liter z DNA wirusa HPV, stwierdza się, obliczając indeks Tversky’ego – miarę podobieństwa badanego elementu do znanego pierwowzoru. I aby wszystko usprawnić, obliczenia wykonuje się równolegle na kilku komputerach.
– Większość innych rozwiązań działa na jednej maszynie, co najwyżej na wielu wątkach obliczeniowych; w naszym rozwiązaniu można uruchamiać obliczenia, mając jeden komputer lub kilka komputerów połączonych w sieć albo korzystać z klastra obliczeniowego, chmury lub superkomputera. Robi się to automatycznie z wyrównywaniem obciążenia pracą (load balancing) – po to, by uzyskać wyniki jak najszybciej, patrząc na czas zegara ściennego – wyjaśnia zastosowaną metodę obliczeń równoległych dr Nowicki.

Nie tylko HPV
Naukowcy z uniwersyteckiego ICM wykazali, że ich algorytm jest jednym z najszybszych, najdokładniejszych i najłatwiejszych sposobów wykrywania genotypów HPV z danych sekwencjonowania nowej generacji. Co więcej, algorytm cechuje się wysoką „skalowalnością”, czyli zdolnością do zwiększania szybkości obliczeń wraz ze wzrostem liczby zasobów obliczeniowych, np. procesorów. Na koniec wiadomość, która ucieszy szerokie grono badaczy: metoda ta jest uniwersalna i z powodzeniem może służyć wykrywaniu DNA mikroorganizmów innych niż HPV.
Linki:
https://heap-exposome.eu/2021/03/31/the-heap-interview-piotr-bala-talks-metagenomics/
https://icm.edu.pl/blog/2025/04/16/szybkie-wykrywanie-sekwencji-wirusow-hpv/
https://academic.oup.com/bib/article/26/2/bbaf155/8109669
* Dane Krajowego Rejestru Nowotworów (onkologia.org.pl)