Quantcast
Channel: Родная Вятка блоги
Viewing all articles
Browse latest Browse all 4752

Давайте сделаем каталог микрофильмов на FamilySearch!

$
0
0

Друзья! Пару месяцев назад я опубликовал новость о том, что решил начать работу по обработке переписных листов Первой всеобщей переписи населения 1897 г. Вятской губернии, которые опубликованы на портале FamilySearch. Был создан раздел с поиском населённых пунктов по заголовку дел, сделана опись страниц. Раздел помогает найти интересующий населённый пункт и сразу перейти на нужное дело на FamilySearch. Пользователи нашего портала довольно хорошо отозвались об этой затее.

Пока что какой-либо оцифровки переписных листов переписи 1897 года не ведётся, но эта работа планируется в отдалённом будущем, хотя и не поставлена в список текущих задач.

Но я решил идти дальше и сделать более удобный поиск дел по всем микрофильмам FS, которые так или иначе связаны с Вятской землёй. Главная проблема заключается в том, что все микрофильмы опубликованы в разных каталогах, ищутся по совершенно разным ключевым словам и тематическим разделам. Мне не удалось найти какой-то единый каталог со списком, скажем, всех оцифрованных микрофильмов, содержащих дела из Центрального Госархива Удмурсткой Республики и Центрального Госархива Республики Татарстан. Но, тем не менее, были найдены 3159 микрофильмов, содержащие дела, так или иначе связанные с географией нашего портала.

При таком объёме микрофильмов количество снимков идёт на миллионы.

Предлагаю общими усилиями заняться составлением описи дел 3159 микрофильмов! Требуется помощь в первую очередь тех, кто уже разобрался в запутанной структуре FS.

Я выгрузил необходимые списки каталогов и дел с FS.

На данный момент мы имеем:

999 каталоговмикрофильмов — на FS они называются «Авторы» или «Темы» (пример).

16 614так называемых Item в этих 999 каталогах. Item — это части микрофильмов, содержащие архивное дело целиком, либо его часть.

Из этих 16+ тысяч Items 10 638содержатся в интересующих нас микрофильмах. Все остальные Items в этих каталогах от других микрофильмов, которые нам не нужны. Почему же так? Приведу пример: Есть каталог Ревизские сказки, 1762-1858 (Main Author: Тула (Тула). Губернская казенная палата). Нас интересует только самый последний микрофильм 7576141, в котором с 519 по 546 страницу содержится дело 154-8-1015 «Ревизские сказки Вятской губернии, 1858»из фонда 154 «Ревизские сказки, выделенные из подлинных дел Ревизского отделения. О разных переселённых крестьянах (дела 997-1028)» [ссылка]. Так как я выгружал с FS список всех Items из всех каталогов с «нашими» 3159 микрофильмов, соответственно в выгруженных данных присутствуют тысячи «ненужных» записей.

Из оставшихся 10 638 ещё некоторая часть выпадет в процессе описания дел. Как в примере выше: нам нужен лишь один Item из микрофильма 7576141 — это дело 154-8-1015, всё остальное в этом микрофильме — не наше.

Какая требуется помощь?

Самое первоочередное — это обработка таблиц со списками «наших» 999 каталогов и 10 638 Items. Иногда заголовок каталога написан по-английски, иногда по-русски, а иногда в сложной транслитерации, типа: Spasskai︠a︡ T︠S︡erkov', Glazovkogo uezda, Vi︠a︡tskoĭ gubernii. В последнем случае я уже произвёл автоматический перевод в кириллицу, получилось довольно неплохо. Например, в этом примере вышло: Спасская Церковь, Глазовкого уезда, Вятской губернии. Почти идеально, не считая пропущенную букву в слове Глазовкого. Однако не везде текст получился таким хорошим.

Думаю, в новом разделе для всех модераторов и активистов будет организована возможность для каждого дела указать действительный заголовок и диапазон номеров страниц. В итоге мы должны получить что-то типа этого: https://rodnaya-vyatka.ru/perepis-1897, но уже не только по переписи 1897 года.

Но перед публикацией списка нужно провести хоть какую-то обработку имеющихся заголовков дел. Кто готов принять участие в этой работе?

Да, чуть не забыл, из этих 3159 микрофильмов 377 содержат данные переписи 1897 года, так что по ним каталог (или опись — кому как больше нравится) мною уже был сделан.

PS: всех поздравляю, сегодня на сайт за всё время его существования зашёл 1 700 000-ый посетитель!


Viewing all articles
Browse latest Browse all 4752

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>