Понад 2 млн. найстаріших постів в Інтернеті виклали у відкритий доступ | NNS - Національна служба новин

Понад 2 млн. найстаріших постів в Інтернеті виклали у відкритий доступ | NNS - Національна служба новин


Розробник-програміст з Канади Джозеф Ярощак оголосив, що публікує у відкритому доступі величезний архів записів на Usenet — найстарішому дискусійному майданчику Інтернету. Він був створений ще в 1980 році, задовго до того, як з’явилася мережа в її сучасному вигляді, і діє досі. Про це NNS повідомляє з посиланням на internetua.com.


За десятиліття до, форумів Reddit або груп в Facebook існував Usenet: рання Інтернет-система дискусій, де можна було починати і приєднуватися до обговорень, так само, як і сьогодні працюють пости з коментарями. Запущений в 1980 році, Usenet — це розробка двох студентів Університету Дьюка, які хотіли спілкуватися між децентралізованими локальними серверами - і цей проект діє досі.


У Usenet люди говорять про все, від нанотехнологій до мильних опер, вина та НЛО. Йозеф Ярощак, системний архітектор з Онтаріо, вперше познайомився з Usenet в 2000 році, коли знайшов постійну роботу в Канаді завдяки розміщенню там вакансії.


На цьому тижні я завантажив деякі з найстаріших повідомлень Usenet, доступних в Інтернеті. Близько 2,1 мільйони повідомлень з архіву UTZOO NetNews Генрі Спенсера за період з лютого 1981 р. по червень 1991 р. зібрані в архіві Usenet і доступні будь-кому,


- сказав Йозеф Ярощак.


Сайт Usenet Archive - це частина іншого, куди більш масштабного проекту, який запустив Джозеф Ярощак. Він використовується також для зберігання постів сучасних незалежних інтернет-проектів, не пов'язаних з корпораціями на зразок Google. Потенційно він може зберігати близько мільярда записів. В даний час він архівує 317 мільйонів повідомлень в 10 000 унікальних груп новин Usenet — і, за оцінками Ярощака, в кінцевому підсумку в ньому буде зберігатися близько 1 мільярда повідомлень.


Генрі Спенсер з Університету Торонто, факультет зоології, зберігав архіви груп на 141 магнітній стрічці.


Стрічки Utzoo-Wiseman Usenet - це, по суті, найбільш ранні доступні обговорення, розміщені в Інтернеті людьми, які працюють в різних університетах, які вже були підключені до Інтернету,


— пояснив Ярощак в інтерв'ю для Vice.


Спенсеру і кільком колегам вдалося перенести дані з магнітної стрічки в формат Tar (Tape ARchive), і Ярощак, який багато років працював архіватором Usenet, перетворив ці стрічки в базу даних PostgreSQL з можливістю пошуку, яку він потім завантажив в архіви Usenet. Попутно, крім парсерів для архіву магнітних стрічок Utzoo, він створив конвертери на PHP, javascript, Java і Python і зробив їх доступними на Github в якості ресурсів з відкритим вихідним кодом, які міг використовувати будь-хто.


З груп Utzoo він завантажив майже 26 300 000 повідомлень і їх кількість продовжує зростати.


Ця скарбниця старих постів повинна бути доступна майбутнім поколінням,


- підсумовує Ярощак.


Ці сотні мільйонів повідомлень може бути цікаво читати, але, що більш важливо, вони проливають світло на розумовий процес інтернет-спільноти на ранніх етапах самого Інтернету. Це величезна кількість важливого історичного та дослідницького контенту. Було б нехтуванням з мого боку і з боку інших архівістів, упустити можливість повернути ці старі текстові групи Usenet з архівів у відкритий доступ,


- зазначив він.


Європа закрита для мандрівників з України: ми потрапили до сірої зони

Рекламні блоки на нашому сайті дозволяють нам бути незалежним ЗМІ, а вам – отримувати оперативну і не проплачену ніким інформацію. Переглядаючи рекламу, ви робите свій внесок у розвиток незалежної журналістики України


Автор: NNS - Національна служба новин
NNS - Національна служба новин. Останні події в Україні та світі



  • winkwinkedsmileam
    belayfeelfellowlaughing
    lollovenorecourse
    requestsadtonguewassat
    cryingwhatbullyangry
Кликните на изображение чтобы обновить код, если он неразборчив