- Категория
- IT и Телеком
- Дата публикации
В сеть слили более 2 млн "древних" интернет-постов — СМИ
Канадский разработчик Джозеф Ярощак выложил в интернет около 2,1 млн постов с одной из первых дискуссионных интернет-площадок Usenet, сообщает Vice.
Как отмечает издание, сетевую платформу создали два студента Университета Дьюка еще в 1980 году, которые пожелали общаться с помощью децентрализованных локальных серверов.
Таким образом, эту сеть создали задолго до того, как широкая публика получила доступ к интернету.
Подписывайтесь на Youtube-канал delo.uaUsenet — сеть, в которой можно общаться и выкладывать файлы. В ней обсуждают все что угодно — от нанотехнологий до мыльных опер, вина и НЛО.
Загруженные Ярощаком посты охватывают временной период в 10 лет — с 1981 по 1991 год. В то время Usenet был закрытой сетью для студентов Университета Дьюка.
Посты доступны на сайте Usenet Archive. По задумке Ярощака, Usenet Archive может хранить в себе около 1 млрд постов.
Сейчас на сайте доступен архив в 315 млн сообщений и 11 тысяч уникальных новостных групп Usenet.
Генри Спенсер из университета Торонто хранил архивы групп на 141 магнитной ленте.
"Ленты UTZOO-Wiseman Usenet — это, по сути, самые ранние доступные обсуждения, размещенные в Интернете людьми, работающими в различных университетах, которые уже были подключены к интернету", — сказал Ярощак.
Спенсеру и нескольким коллегам удалось перенести данные с магнитной ленты в формат .TAR (Tape ARchive), и Ярощак, который много лет работал архиватором Usenet, преобразовал эти ленты в базу данных PostgreSQL с возможностью поиска, которую он затем загрузил в архивы Usenet.
Попутно он создал конвертеры на PHP, JavaScript, Java и Python и сделал их доступными на своем Github в качестве ресурсов с открытым исходным кодом, которые мог использовать любой желающий.
"Эта сокровищница старых постов должна быть доступна для будущих поколений. Эти сотни миллионов сообщений интересно читать, но, что более важно, они проливают свет на мыслительный процесс интернет-сообщества на ранних этапах самого интернета. Это огромное количество важного исторического и исследовательского контента", — отметил Ярощак.
Напомним, в интернете обнаружили открытый сервер Elasticsearch, который содержит данные более 150 млн пользователей социальных сетей Facebook, LinkedIn и Instagram.