2015-7-21 19:04 |
Министерство финансов РФ опубликовало сканы исторических бюджетных документов. На портале представлены бюджетные росписи Российской империи и бюджетные справочники РСФСР и СССР с 1866 по 1990 гг.
, в общей сложности 86 документов. Каждый из них можно скачать в формате PDF или просмотреть прямо в браузере. На сайте Минфина уточняется, что «публикация оригинальных исторических документов является инициативой Минфина России, направленной на приобщение граждан к информации об устройстве финансовой системы государства и одним из шагов по повышению информационной открытости Министерства». Кроме того, эти документы представляют собой фактографическую базу, на которые может опираться историческое знание. В этом смысле этот проект находится в русле «позитивистского» подхода к истории в том же смысле, что и другой независимо от него развивающийся проект «Руниверс».
В перспективе Минфин также планирует оцифровку и публикацию «пояснительных записок, исторической аналитики и других документов, определявших устройство финансовой системы в различные периоды российской истории».
Публикация сканов как таковая - это уже большой шаг к повышению доступности исторических данных. Однако в том виде, в котором они сейчас представлены, аналитическая работа с ними практически невозможна: данных очень много, а PDF-документы нельзя проанализировать машинными методами, как того бы требуют объемы и сложная структура. Следующим шагом должен быть перевод этих данных в машиночитаемый формат. Здесь есть большие сложности, связанные с тем, что алгоритмизировать этот процесс сложно. Не в последнюю очередь, это связано с тем, что большое количество документов содержат текст с дореволюционной орфографией, к которой компьютеры пока не адаптированы. Кроме того, чтобы перевести эти данные в структурированный вид, необходимо хорошо изучить структуру документов, чтобы представить их грамотно и без ошибок.
Такие попытки уже предпринимались в сотрудничестве с НП «Инфокультура». Несколько наборов исторических бюджетных данных уже опубликованы в пригодном для анализа виде. По итогам конкурса BudgetApps в этом году на их основе даже разрабатывались приложения. Однако эти данные переводились в машиночитаемый вид фактически вручную, и это, конечно, был очень длительный процесс. Вероятно, в дальнейшем будут разработаны более эффективные способы обработки. Этому очень способствует публикация сканов в открытом доступе, так как теперь разработкой методов и переводом в электронный вид могут заниматься все, кому это так или иначе интересно. В частности, это могут быть историки, программисты и журналисты.
.Аналог Ноткоин - TapSwap Получай Бесплатные Монеты
Подробнее читайте на polit.ru
Источник: polit.ru | Рейтинг новостей: 140 |