Купити квартиру в Дніпрі

Без категорії

Понад 2 млн. найстаріших постів в Інтернеті виклали у відкритий доступ

Понад 2 млн. найстаріших постів в Інтернеті виклали у відкритий доступ

Розробник-програміст з Канади Джозеф Ярощак оголосив, що публікує у відкритому доступі величезний архів записів на Usenet — найстарішому дискусійному майданчику Інтернету. Він був створений ще в 1980 році, задовго до того, як з’явилася мережа в її сучасному вигляді, і діє досі. Про це НСН повідомляє з посиланням на internetua.com.

За десятиліття до, форумів Reddit або груп в Facebook існував Usenet: рання Інтернет-система дискусій, де можна було починати і приєднуватися до обговорень, так само, як і сьогодні працюють пости з коментарями. Запущений в 1980 році, Usenet — це розробка двох студентів Університету Дьюка, які хотіли спілкуватися між децентралізованими локальними серверами – і цей проект діє досі.

У Usenet люди говорять про все, від нанотехнологій до мильних опер, вина та НЛО. Йозеф Ярощак, системний архітектор з Онтаріо, вперше познайомився з Usenet в 2000 році, коли знайшов постійну роботу в Канаді завдяки розміщенню там вакансії.

На цьому тижні я завантажив деякі з найстаріших повідомлень Usenet, доступних в Інтернеті. Близько 2,1 мільйони повідомлень з архіву UTZOO NetNews Генрі Спенсера за період з лютого 1981 р. по червень 1991 р. зібрані в архіві Usenet і доступні будь-кому,

– сказав Йозеф Ярощак.

Сайт Usenet Archive – це частина іншого, куди більш масштабного проекту, який запустив Джозеф Ярощак. Він використовується також для зберігання постів сучасних незалежних інтернет-проектів, не пов’язаних з корпораціями на зразок Google. Потенційно він може зберігати близько мільярда записів. В даний час він архівує 317 мільйонів повідомлень в 10 000 унікальних груп новин Usenet — і, за оцінками Ярощака, в кінцевому підсумку в ньому буде зберігатися близько 1 мільярда повідомлень.

Генрі Спенсер з Університету Торонто, факультет зоології, зберігав архіви груп на 141 магнітній стрічці.

Стрічки Utzoo-Wiseman Usenet – це, по суті, найбільш ранні доступні обговорення, розміщені в Інтернеті людьми, які працюють в різних університетах, які вже були підключені до Інтернету,

— пояснив Ярощак в інтерв’ю для Vice.

Спенсеру і кільком колегам вдалося перенести дані з магнітної стрічки в формат Tar (Tape ARchive), і Ярощак, який багато років працював архіватором Usenet, перетворив ці стрічки в базу даних PostgreSQL з можливістю пошуку, яку він потім завантажив в архіви Usenet. Попутно, крім парсерів для архіву магнітних стрічок Utzoo, він створив конвертери на PHP, JavaScript, Java і Python і зробив їх доступними на Github в якості ресурсів з відкритим вихідним кодом, які міг використовувати будь-хто.

З груп Utzoo він завантажив майже 26 300 000 повідомлень і їх кількість продовжує зростати.

Ця скарбниця старих постів повинна бути доступна майбутнім поколінням,

– підсумовує Ярощак.

Ці сотні мільйонів повідомлень може бути цікаво читати, але, що більш важливо, вони проливають світло на розумовий процес інтернет-спільноти на ранніх етапах самого Інтернету. Це величезна кількість важливого історичного та дослідницького контенту. Було б нехтуванням з мого боку і з боку інших архівістів, упустити можливість повернути ці старі текстові групи Usenet з архівів у відкритий доступ,

– зазначив він.

Понад 2 млн. найстаріших постів в Інтернеті виклали у відкритий доступ

Раніше ми повідомляли: Європа закрита для мандрівників з України: ми потрапили до сірої зони

Рекламні блоки на нашому сайті дозволяють нам бути незалежним ЗМІ, а вам – отримувати оперативну і не проплачену ніким інформацію. Переглядаючи рекламу, ви робите свій внесок у розвиток незалежної журналістики України

To Top
Пошук
e-mail
Важливі
Новини
Lite
Отримати допомогу