Библиотека как лабораторный обзор: поддержка вычислительного использования веб-коллекций
Posted: Wed Jul 09, 2025 4:26 am
Для учёных, особенно гуманитариев, библиотека — это лаборатория. Опубликованные работы и рукописи — это их научные материалы. Сегодня для проведения значимых исследований необходим также доступ к современным наборам данных, облегчающим интеллектуальный анализ данных и машинное обучение.
2 марта Архив Интернета запустил новую серию вебинаров, посвящённых его усилиям по поддержке научных исследований с большим объёмом данных и проектов в области цифровых гуманитарных наук. Первая сессия была посвящена методам и технологиям масштабного анализа веб-архивов.
Посмотрите запись сеанса прямо сейчас:
«Если у нас будут коллекции культурных материалов, полезные и простые в использовании, но при этом Библиотека телефонных номеров правообладателей, то мы сможем начать получать более глубокое представление о том, что происходит в экосистеме медиа», — сказал основатель Архива Интернета Брюстер Кейл.
Что можно сделать с миллиардами архивированных веб-страниц? Возможности безграничны.
Джефферсон Бейли, директор отдела веб-архивирования и служб данных Internet Archive, и Хельге Хольцманн, инженер по веб-данным, поделились некоторыми техническими проблемами, которые следует учитывать библиотекам, а также инструментами, позволяющими сделать большие объемы цифрового контента доступными для общественности.
Интернет-архив собирает информацию из интернета различными методами, включая глобальный и доменный поиск, партнёрские программы по сбору данных и службы курирования. Он сохраняет различные типы контента (текст, код, аудиовизуальные материалы) в различных форматах.
2 марта Архив Интернета запустил новую серию вебинаров, посвящённых его усилиям по поддержке научных исследований с большим объёмом данных и проектов в области цифровых гуманитарных наук. Первая сессия была посвящена методам и технологиям масштабного анализа веб-архивов.
Посмотрите запись сеанса прямо сейчас:
«Если у нас будут коллекции культурных материалов, полезные и простые в использовании, но при этом Библиотека телефонных номеров правообладателей, то мы сможем начать получать более глубокое представление о том, что происходит в экосистеме медиа», — сказал основатель Архива Интернета Брюстер Кейл.
Что можно сделать с миллиардами архивированных веб-страниц? Возможности безграничны.
Джефферсон Бейли, директор отдела веб-архивирования и служб данных Internet Archive, и Хельге Хольцманн, инженер по веб-данным, поделились некоторыми техническими проблемами, которые следует учитывать библиотекам, а также инструментами, позволяющими сделать большие объемы цифрового контента доступными для общественности.
Интернет-архив собирает информацию из интернета различными методами, включая глобальный и доменный поиск, партнёрские программы по сбору данных и службы курирования. Он сохраняет различные типы контента (текст, код, аудиовизуальные материалы) в различных форматах.