Библиотека как лабораторный обзор: поддержка вычислительного использования веб-коллекций

Self-hosted database solution offering control and scalability.
Post Reply
shukla7789
Posts: 1112
Joined: Tue Dec 24, 2024 4:28 am

Библиотека как лабораторный обзор: поддержка вычислительного использования веб-коллекций

Post by shukla7789 »

Для учёных, особенно гуманитариев, библиотека — это лаборатория. Опубликованные работы и рукописи — это их научные материалы. Сегодня для проведения значимых исследований необходим также доступ к современным наборам данных, облегчающим интеллектуальный анализ данных и машинное обучение.

2 марта Архив Интернета запустил новую серию вебинаров, посвящённых его усилиям по поддержке научных исследований с большим объёмом данных и проектов в области цифровых гуманитарных наук. Первая сессия была посвящена методам и технологиям масштабного анализа веб-архивов.

Посмотрите запись сеанса прямо сейчас:


«Если у нас будут коллекции культурных материалов, полезные и простые в использовании, но при этом Библиотека телефонных номеров правообладателей, то мы сможем начать получать более глубокое представление о том, что происходит в экосистеме медиа», — сказал основатель Архива Интернета Брюстер Кейл.

Что можно сделать с миллиардами архивированных веб-страниц? Возможности безграничны.

Джефферсон Бейли, директор отдела веб-архивирования и служб данных Internet Archive, и Хельге Хольцманн, инженер по веб-данным, поделились некоторыми техническими проблемами, которые следует учитывать библиотекам, а также инструментами, позволяющими сделать большие объемы цифрового контента доступными для общественности.

Интернет-архив собирает информацию из интернета различными методами, включая глобальный и доменный поиск, партнёрские программы по сбору данных и службы курирования. Он сохраняет различные типы контента (текст, код, аудиовизуальные материалы) в различных форматах.
Post Reply