Обзор возможностей утилиты для работы со списками «ДНК-совпаденцев» в российском сервисе «Генотек»
Автор – Рустам Усманов (распространяется бесплатно здесь)
В первичной нашей публикации «О чем могут поведать гены», связанной с личным опытом ДНК-тестирования, мы поделились впечатлениями, некоторой аналитикой и возможностями по поиску родственников через популярные российские и иностранные сервисы, а также о том, каким образом полученные данные можно интерпретировать и использовать в своей работе. По мере поступления информации статья продолжает корректироваться и дополняться, являясь своего рода персональным помощником и справочником. Авторские впечатления вызвали интерес и обсуждения, благодаря которым многим из нас удалось подтянуть кругозор, за что и выражаем благодарность всем откликнувшимся. Мы в очередной раз убедились, насколько ДНК-тестирование является привлекательным и перспективным. Вполне логичным оказался факт того, что весь актив Родной Вятки– админы и модераторы проекта в большинстве уже оказались глубоко в теме или в ходе обсуждений оперативно подключились к работе, пройдя такое тестирование и получив интересный опыт. Как это в будущем отразится на проекте – покажет лишь время.
Для тех, кто еще только подумывает о такой возможности, поделимся альтернативной ссылкой на статьюнашего коллеги, предназначенную для сомневающихся и для новичков: - «Поиск живых родственников и информации о дальних предках через тест ДНК. Часть 1 - Как ДНК может помочь узнать предков?». Материал изложен доходчиво, поэтому рекомендуем ознакомиться и сделать персональные выводы об актуальности ДНК-тестирования в ваших семьях.
Мы ориентируемся на возможности российского сервиса «Генотек», как более понятного российскому капризному потребителю (а мы очень капризны). «Хотелок» и пожеланий к сервису у нас очень много, надеемся, что со временем большинство из наших чаяний найдет свое воплощение в функциональных возможностях российской компании. В пользу «Генотек» следует отнести факт стремительно наращиваемой клиентской базы. Точное число клиентов «Генотек», конечно же, неизвестно, это значение не является публичной информацией, однако используя некоторые аналитические возможности, можно определить, что по состоянию на начало сентября 2022 года число клиентов «Генотек» составляет величину 340 тыс. (+/- 500) человек. Процесс динамичен, еженедельно число подгружаемых в систему тестов увеличивается. Для автора число выявленных только за 2 последних месяца новых «совпаденцев» составило величину 110 человек, т.е. почти 1/7 от первоначально выявленного их количества. Интересно было бы узнать о впечатлениях первой сотни протестировавшихся в «Генотек» лиц и как ДНК-тестирование повлияло на их жизнь. Насколько нам известно, в первую 20-ку таковых людей когда-то вошли персоны, чьи фотографии мы имеем возможность наблюдать на обложках журнала «Forbes».
Обширная клиентская база «Генотек» приводит к следующим приятным последствиям: список выявленных «совпаденцев» (вероятных родственников) значителен и постоянно растет. Если очень не повезло – то количество обнаруженных вероятных родственников составит величину около 360 человек, ну а тем, кому повезло – величина может составить от 2.5 до 3.5 тыс. человек. Если для выявленных 360 человек фильтрация списка «совпаденцев» в ручном режиме особого труда не составляет, то при более высоких значениях выявленных «совпаденцев» существует риск сломать мозг, разбираясь в полученных результатах. «Генотек» в данном направлении пока занимает выжидательную позицию, возлагая задачу спасения утопающих на самих утопающих. Возможно, что в «Генотек» такие инструменты уже имеются, либо они дорабатываются для коммерческих целей.
К счастью, в России не перевелись еще умельцы, пытающиеся на коленках создавать вспомогательные инструменты для анализа «совпаденцев». Об утилите такого левши мне и хотелось бы рассказать. В зависимости от пожеланий автора и обращающихся к нему лично заинтересованных лиц, программное средство периодически модифицируется и совершенствуется. Идея составить обзор о результатах работы с данной утилитой давно назрела и настоящая статья родилась под впечатлением от результатов её испытания. Для особо продвинутых пользователей, не желающих тратить время на изучение подробной инструкции по использованию утилиты, вполне достаточно перейти к предпоследнему абзацу в настоящей статье, в котором, кратко и изложены возможности программы.
Утилита от Рустама Усманова позволяет осуществить экспорт сведений о родственниках из личного кабинета «Генотек» в автономный документ с возможностью сортировки и фильтрации среди «совпаденцев». Это основные возможности утилиты, которыми мы пользуемся. В качестве дополнительной возможности, предусмотрен экспорт генеалогического древа в формате XML для работы в Gramps 1.7.1. (т.е. для работы с древом потребуется скачать и установить бесплатную программу и работать с экспортированным генеалогическим древом в этой программе). Очень часто клиенты «Генотек» жалуются на то, что невозможно загрузить в сервис «Генотек» готовые древа из сторонних сервисов. Да, эта проблема пока не решена. На сегодняшний день обеспечена лишь возможность обратного процесса, за счет программного средства Рустама. При помощи Grampsданные из экспортированного древа можно импортировать и экспортировать в иные форматы. Т.е. у нас фактически имеется универсальный инструмент, благодаря которому труды по составлению древа в «Генотек» возможно использовать в сторонних сервисах.
Что нужно для того, чтобы осуществить экспорт данных о «совпаденцах»? Ответ: современный браузер с поддержкой JavaScript (автор использует в качестве такого браузера - Google Chrome) и система управления пользовательскими скриптами, например, Tampermonkey. Скачать и установить систему управления скриптами можно здесь. Браузер Google Chrome можно установить с официального сайта. Установка и того и другого примитивна.
Установка утилиты Рустама Усманова осуществляется непосредственно по ссылке. После этого вы готовы к дальнейшей работе.
Как использовать утилиту: В личном кабинете «Генотек» в разделе Поиск родственников в панели фильтров после установки утилиты появится ссылка/кнопка на документ с экспортируемыми сведениями. На рисунке кнопка обведена квадратом.
При нажатии на ссылку/кнопку проиcходит загрузка документа в формате HTML. Загруженный документ и является списком ваших «совпаденцев». Название файла присваивается автоматически и имеет следующий вид: «ung(хх).html», где хх – номер последнего скачанного на компьютер списка «совпаденцев», присвоенный браузером при его загрузке. При первичной загрузке списка файл будет носить название «ung.html».
Если вы еще не обменивались ссылками на профили в «Генотек» с коллегами, осуществившими ДНК-тестирование - непременно это сделайте. Это позволит вам использовать все дополнительные возможности установленной утилиты. Не все понимают, как это сделать, поэтому объясняем: в личном кабинете «Генотек» в правом верхнем углу нажимаем на значок пользовательского меню (в нашем случае он выглядит как буква «Е» в кружочке, сокращение от «Елена»). При нажатии на кнопку «копировать ссылку» указатель на ваш профиль копируется в буфер обмена. Поделитесь им с вашими друзьями любым удобным способом. Ссылка активна не более суток.
Если вам прислали такую ссылку, откройте её и вы попадете на страницу авторизации в личный кабинет «Генотек». Авторизуйтесь. Откроется ваш кабинет, который в это время будет слабо реагировать на ваши «клики», слегка «зависая». Не пугайтесь, система в это время прописывает для вас новые возможности. Если вы сразу начнете искать изменения, произошедшие в интерфейсе, то вы их не обнаружите. В системе используется не очевидный механизм добавления «друзей». Ничего страшного, вы быстро привыкнете. Для того, чтобы обнаружить произошедшие в кабинете изменения потребуется обновить веб-страничку в браузере (например, нажав на F5 или заново авторизоваться в профиле). После обновления в личном кабинете появится новый, добавленный и нужный вам пользователь. Выглядеть это будет примерно так, как показано на скриншотах ниже. Выбираете нужного вам пользователя и осуществляете в режиме просмотра изучение данных о происхождении, а также о древе или о здоровье поделившегося с вами ссылкой коллеги. Объем возможных для просмотра сведений ограничен пользовательскими настройками безопасности профиля поделившегося, а также доступным для него в «Генотек» функционалом. Если коллега прошел только тест на происхождение, то возможности просмотра данных о его здоровье вам будут изначально недоступны. Технически личный кабинет коллеги будет выглядеть для вас также, как свой собственный кабинет. В разделе Поиск родственниковсбоку будет присутствовать заветная кнопка, запускающая работу утилиты Рустама. Нажимая на нее, вы можете скачать на компьютер список «совпаденцев» для вашего друга/коллеги/родственника. Аналогичную операцию вы можете осуществить по отношению ко всем вашим друзьям.
Обратим внимание на то, что в друзьях можно находиться не 24 часа (как можно подумать), а сколь угодно долго, пока человек, решивший прекратить с вами «дружить» не удалит вас из списка своих друзей, лишив вас возможности просматривать своих «совпаденцев» и древо.
Скачав документ и открыв его в браузере, вы получите доступный для дальнейшей работы документ. Открывайте его в том же браузере, в котором скачали файл.
Общий вид документа выглядит примерно следующим образом:
Акцентируем внимание на том, что скачанные файлы "совпаденцев"вида "ung.(xxx)"рекомендуется открывать не из проводника, как многие инстинктивно пытаются сделать (хотя это и возможно), а из самого браузера, в пределах одной сессии (т.е. осуществив последовательно загрузку файлов "совпаденцев", не закрывая Google). Только в этом случае вы увидите заветные "галочки"вверху над шапкой таблицы. Если для программистов такой алгоритм очевиден, то для людей, не понимающих, как работают скрипты, результат будет отличаться от ожидаемого. 😉
В скачанных документах возможна сортировка по ссылкам в шапке таблицы. Доступные поля для сортировки: Имя, возраст, пол, сумма общих сегментов ДНК, степень общности генома, максимальный сегмент ДНК среди общих хромосом, гаплогруппы по мужской и женской линиям и дата обнаружения «совпаденца» для данной персоны.
Анализируя список с датами, можно сделать вывод о том, что поток клиентов в «Генотек» внушительный, каждые 2-3 дня в системе выявляются очередные «совпаденцы».
Обратим внимание на «галочки» над шапкой таблицы и на список указанных над таблицей персон: это и есть ваши друзья/родственники, поделившиеся с вами ссылками на свои профили, чьи данные вы скачали на компьютер. Поставив «галочку» напротив соответствующей персоны, вы получите коротенький список ваших общих «совпаденцев». Это и есть та самая «вундервафля» утилиты - ФИЛЬТРАЦИЯ. Именно это мы все и желаем видеть в официальных возможностях «Генотек». Интересно, что общие «совпаденцы» между двумя любыми персонами обнаруживаются всегда. Среди полезностей утилиты имеется возможность поставить «галочки» для фильтрации сразу в отношении нескольких персон, отфильтровав таким образом общих между ними «совпаденцев». Для реальных, известных родственников 4-й и 5-й степеней родства такие лица всегда обнаруживаются и являются первыми кандидатами для дальнейшей работы.
Таким образом, максимально эффективный алгоритм поиска среди "совпаденцев"настоящих, а не ложноположительных родственников, заключается в следующем:
1. "Подружиться"с верифицированными родственниками, прошедшими ДНК-тестирование.
2. Выявить с помощью утилиты общих с вами "совпаденцев".
3. В приоритете собственных исследований акцентировать свое внимание именно на общих "совпаденцах".
4. Повторить цикл уже для них, постепенно расширяя круг поисков.
Именно эти "круги"и будут являться стержневым направлением для дальнейших поисков, имеющих перспективу. В случае географической удаленности предков друг от друга, "круги"будут иметь разные направления распространения, которые можно в дальнейшем обрабатывать интуитивно или через математический анализ.
При наличии у пользователя некоторых навыков программирования, утилита без проблем модернизируется под конкретные нужды потребителя.
В заключение приведу цитату из памятки-описания к работе утилиты от её автора, которая в нескольких строчках максимально лаконично трактует её возможности:
«После открытия документа появляются возможности сортировки по ссылкам в шапке таблицы и фильтрации общих для нескольких профилей родственников. Фильтрация общих с каким-либо профилем родственников возможна при предварительном посещении раздела Поиск родственников в этом профиле. При просмотре собственного генеалогического древа, либо древа родственника в заголовке окна появится ссылка на документ с экспортируемыми сведениями».
Остается лишь горячо поблагодарить автора за предоставленную нам возможность анализа списков «совпаденцев», значительно облегчающую поисковые мероприятия. Надеемся, что автор в будущем порадует нас дополнительным функционалом.