uzluga.ru
добавить свой файл
1



Появление крупных, представительных научных ЭБ

  • Появление крупных, представительных научных ЭБ

  • Информационные ресурсы большинства научных ЭБ – коллекции электронных версий научных публикаций

  • Как правило коллекции информационных ресурсов таких ЭБ – множества несвязанных информационных объектов (ИО)

  • Некоторые ЭБ этого вида позволяют поддерживать связи цитирования или имеют механизмы, обеспечивающие экстракцию из текстов ссылок на цитируемые источники

  • На этой основе осуществляются наукометрические измерения

  • К сожалению, эти связи – «немые», они не несут семантики

  • Вместе с тем, функциональность крупных научных текстовых ЭБ может быть существенно обогащена за счет семантического структурирования их контента

  • Кроме того, научные ЭБ могут включать не только текстовые информационные ресурсы.



Цель данной работы – создание технологии, обеспечивающей:

  • Цель данной работы – создание технологии, обеспечивающей:

    • семантическое структурирование контента научных ЭБ с поддержкой явно представленных семантических связей
    • возможность включения в семантическую структуру ЭБ информационных объектов различных типов
    • поддержку семантических связей различных категорий и типов
    • создание онтологий связей для каждой категории и использование их в описаниях связей
    • описание связей структурированными метаданными
    • создание механизмов, которые позволяют создавать, поддерживать и использовать семантические связи в ЭБ
    • формирование семантической структуры контента в онлайновом децентрализованном режиме
    • Семантическая связь – это связь, семантика которой явно определена в системе и которая поддерживается системными механизмами
  • Учитываются только связи научного и научно-организационного характера между ИО научной ЭБ.



Поддержка явным образом представленных связей, описанных структурированными метаданными, и создание соответствующих механизмов в системе управления онлайновой ЭБ обеспечивают:

  • Поддержка явным образом представленных связей, описанных структурированными метаданными, и создание соответствующих механизмов в системе управления онлайновой ЭБ обеспечивают:

    • визуализацию семантической структуры контента ЭБ и навигационный доступ пользователей к ее ИО
    • более дифференцированные возможности для наукометрии
    • возможности исследования развития научных направлений на основе анализа топологии графов связей ИО-публикаций
    • более развитые возможности реализации технологии «живых» документов
    • получение сведений для научно-организационной работы
    • Децентрализованное формирование связей в онлайновом режиме создает также среду для новых форм научной деятельности и научных коммуникаций
    • Повышается эффективность использования накопленного корпуса знаний.


Процесс логического развития существующих научных знаний. Автор научного произведения (НП) устанавливает связи между представленными в нем его результатами и теми результатами, которые опубликованными в других НП, в ситуации, когда он усиливает, уточняет, расширяет область действия этих известных результатов.

  • Процесс логического развития существующих научных знаний. Автор научного произведения (НП) устанавливает связи между представленными в нем его результатами и теми результатами, которые опубликованными в других НП, в ситуации, когда он усиливает, уточняет, расширяет область действия этих известных результатов.

  • Процесс присоединения нового НП к существующему корпусу научных знаний. При этом происходит установление связей этого НП с другими известными НП, которые могут не являться основой для получения результатов данного НП, но имеют к ним какое-либо иное отношение. Например, в новом НП используются данные, опубликованные в другом НП, или в новом НП дается иное доказательство теоремы по сравнению с опубликованным в другом НП.



Процесс формирования мнений об опубликованных научных результатах и оценки содержащих их НП. При этом возможен весь спектр оценок: от позитивной (признание, поддержка и др.) до негативной (сомнение, несогласие, обвинение в плагиате и др.).

  • Процесс формирования мнений об опубликованных научных результатах и оценки содержащих их НП. При этом возможен весь спектр оценок: от позитивной (признание, поддержка и др.) до негативной (сомнение, несогласие, обвинение в плагиате и др.).

  • Процесс систематизации, классификации и упорядочения содержания корпуса научных знаний. Типичными видами таких процессов являются: написание научных обзоров, классификация научных публикаций и создание тематических указателей в конкретных областях науки т.п.

  • Процесс инновационных исследований, пионерских работ «с чистого листа». Такие работы становятся объектами цитирования в многочисленных других работах.



Разновидности связей: с. цитирования, с. между компонентами ИО, с. версионные (между историческими версиями ИО и ИО, различающиеся формами представления), с. административные…

  • Разновидности связей: с. цитирования, с. между компонентами ИО, с. версионные (между историческими версиями ИО и ИО, различающиеся формами представления), с. административные…

  • В предлагаемой технологии рассматриваются только поддерживаемые системными механизмами связи с явным образом определенной семантикой – семантические связи

  • В отличие от них, для поддерживаемых в некоторых ЭБ «немых» связей семантика явно не определена

  • Рассматриваются только бинарные ориентированные связи

  • Связи категоризируются, категория включает ряд типов связей

  • Семантика связей определяется онтологиями

  • Онтология создается для каждой категории связей и определяет набор типов (классов) семантических связей

  • Два ИО могут быть участниками нескольких связей одного и того же типа, установленных одним или разными авторами; это множество связей не должно быть противоречивым.



Полномочиями для создания связей обладают зарегистрированные в системе:

  • Полномочиями для создания связей обладают зарегистрированные в системе:

    • авторы информационных объектов
    • пользователи ЭБ
  • Автор ИО, в отличие от авторизованного пользователя ЭБ, может создавать связи, описание которых встраивается в метаданные его ИО, например, связи цитирования (такие метаданные поддерживаются, в частности, в Открытых архивах)

  • Предполагается , что для авторов информационных объектов, как и для пользователей ЭБ, поддерживаются их профили

  • В профилях авторов указывается адрес электронной почты для направления им сообщений системой оповещения об изменения в составе и/или в свойствах связей, участниками которых являются их ИО.



Связи создаются в ЭБ с помощью специальных сервисов

  • Связи создаются в ЭБ с помощью специальных сервисов

  • При этом используются словари категорий связей, созданные на основе соответствующей этой категории онтологии

  • Каждый словарь содержит набор типов связей данной категории

  • Словари определяют также для каждого типа ИО те типы связей, в которых объекты данного типа могут быть участниками

  • При создании новых экземпляров связей контролируется непротиворечивость нового состояния системы связей

  • Семантическое структурирование контента ЭБ приводит к образованию многослойной семантической структуры

  • Каждый ее слой соответствует некоторой категории или какому-либо типу связей.



Если в ЭБ предусмотрена поддержка метаобъектов, описывающих свойства ее ИО, то при создании связи автором ИО-исходного участника связи описание этой связи может включаться в метаданные ИО

  • Если в ЭБ предусмотрена поддержка метаобъектов, описывающих свойства ее ИО, то при создании связи автором ИО-исходного участника связи описание этой связи может включаться в метаданные ИО

  • В противном случае связь представляется как самостоятельный ИО определенного типа

  • Множество связей, созданных одним лицом, организуется в виде одной или нескольких коллекции в ЭБ

  • Пользователи ЭБ и авторы представленных в ней ИО могут оперировать связями независимо от коллекций, которым они принадлежат.



Описание экземпляра связи – самостоятельного ИО (связи-ИО) включает следующие атрибуты:

  • Описание экземпляра связи – самостоятельного ИО (связи-ИО) включает следующие атрибуты:

    • уникальный идентификатор создаваемого экземпляра связи
    • уникальный идентификатор исходного ИО – участника связи
    • уникальный идентификатор целевого ИО
    • категория связи
    • класс связи
    • автор связи
    • отметка времени (времени создания этого экземпляра)
    • комментарий.


Предусматривается несколько разновидностей связей-ИО по составу их участников:

  • Предусматривается несколько разновидностей связей-ИО по составу их участников:

    • связи «НП – НП»
    • связи «автор/пользователь – НП»
    • связи «автор/пользователь – связь-ИО»
    • Зарегистрированные авторы и пользователи представляются в ЭБ их профилями, которые представляют их в связях
    • Научные произведения могут быть книгами или их главами, статьями, диссертациями, авторефератами, рецензиями…
    • ИО – участники конкретной связи имеют уникальные идентификаторы, которые используются в ее описании.


Для определения семантики связей используются онтологии

  • Для определения семантики связей используются онтологии

  • Активные разработки онтологий связей между научными публикациями

  • Наиболее активно занимаются специалисты в области наук о жизни, прежде всего в биомедицине

  • Полученные результаты не специфичны для этой области знаний

  • Разработан ряд онтологий: CiTO (Citation Typing Ontology), DoCo (Document Components Ontology), SWAN (Semantic Web Applications in Neuromedicine) и ряд других

  • Эти частные онтологии были сведены в единую систему онтологий, называемую SPAR (Semantic Publishing and Referencing Ontologies)

  • В ней акценты - на использование в издательском деле – онтология ролей в издательском деле PRO (Publishing Role Ontology, онтология состояний издания PSO (Publishing Status Ontology) …



Другая разработка – стандарт SKOS (Simple Knowledge Organization System) консорциума W3C. По существу, это - онтология связывания научных данных. Более агрегирована и более ограничена по сравнению с онтологиями, входящими в состав SWAN.

  • Другая разработка – стандарт SKOS (Simple Knowledge Organization System) консорциума W3C. По существу, это - онтология связывания научных данных. Более агрегирована и более ограничена по сравнению с онтологиями, входящими в состав SWAN.

  • Наконец, европейский проект CERIF (Common European Research Information Format), цель которого – разработка обобщенной концептуальной модели научных данных. В рамках этого проекта ведутся работы по определению стандартизованной семантики отношений между объектами научных информационных систем CRIS (Common Research Information System).

  • Онтологии связей, разработанные для наших целей, созданы на основе перечисленных проектов.



Категория оценочных связей:

  • Категория оценочных связей:

    • Позитивно оценивает целевой
    • Негативно оценивает целевой
    • Нейтрально оценивает целевой
    • Опровергает результаты целевого
    • Содержит более общий результат
    • Содержит частный случай результатов целевого
    • Является плагиатом целевого
    • Уточняет результаты целевого
    • Подтверждается результатами целевого
    • Указанная семантика связи относится к ее исходному ИО.


Категория связей компонентов/версий:

  • Категория связей компонентов/версий:

    • Дубликат целевого
    • Презентация целевого
    • Аудио-версия целевого
    • Аннотация целевого
    • Раздел целевого
    • Иллюстрация целевого
    • Оглавление целевого
    • Приложение целевого
    • Библиография целевого
    • Глоссарий целевого
    • Указанная семантика связи относится к ее исходному ИО.


Категория связей организаций - публикаций:

  • Категория связей организаций - публикаций:

    • Является обладателем прав на целевое
    • Является издателем целевого
    • Является автором целевого
  • Категория связей персон - публикаций:

    • Является автором/соавтором целевого
    • Является редактором целевого
    • Является рецензентом целевого
    • Указанная семантика связи относится к ее исходному ИО.


Реализация рассмотренной технологии осуществляется в среде системы Соционет, основанной на технологиях OAI

  • Реализация рассмотренной технологии осуществляется в среде системы Соционет, основанной на технологиях OAI

  • Соционет является адекватным полигоном для реализации проекта:

    • «живая» система, поддерживающая крупные информационные ресурсы
    • обладает развитыми средствами, некоторые из которых могут быть использованы для реализации
    • новые механизмы встраиваются в имеющуюся систему, а не создаются с «чистого листа»
    • за счет механизмов семантического структурирования обогащаются возможности технологии «живых» документов
  • Ресурсы Соционет: авторов – более 6000 (38000), организаций – 151 (12300), коллекций- 367 (4500), документов – 153000 (1.5 млн)

  • Реализация проекта на этом полигоне позволяет после завершения каждого этапа сразу же предоставлять новые возможности пользователям системы.



Для реализации рассматриваемой технологии в Соционет необходимо:

  • Для реализации рассматриваемой технологии в Соционет необходимо:

    • обеспечить поддержку новых типов информационных объектов (ИО-связи, ИО-словари связей…)
    • разработать онтологии связей выбранных категорий и создать представляющие их словари
    • разработать систему статистических показателей, которую должна генерировать система
    • разработать методы визуализации и анализа топологии графов связей
    • реализовать комплекс новых сервисов системы, необходимых для реализации технологии семантического связывания
  • В настоящее время частично разработан прототип

  • Используется ряд имеющихся в Соционет механизмов.



Создание словарей связей, средств их поддержки и дополнения

  • Создание словарей связей, средств их поддержки и дополнения

  • Децентрализованное создание экземпляров связей разных типов и категорий в онлайновом режиме

  • Удаление, модификация связей (изменение их атрибутов)

  • Визуализация связей (слои и др. подструктуры ), формирование навигационных графов и поддержка навигации

  • Поиск объектов, участвующих в связях с данным объектом как с исходным или как с целевым и удовлетворяющих заданному критерию

  • Формирование статистики, в том числе, связанной с процессами формирования и изменения структуры связей

  • Мониторинг состояния структуры связей и обработка событий ее изменений (активизация сервиса оповещения …)

  • Оповещение авторов ИО, участвующих в изменившихся связях.



Автор ИО оповещается системой по e-mail, когда этот ИО становится участником новой либо изменившейся связи или когда изменяется ИО, связанный с ним какой-либо связью

  • Автор ИО оповещается системой по e-mail, когда этот ИО становится участником новой либо изменившейся связи или когда изменяется ИО, связанный с ним какой-либо связью

  • Для этой цели дорабатывается система оповещения, созданная в Соционет для поддержки технологии «живых» документов

  • Авторы ИО – участников связей и другие пользователи системы могут реагировать на установленные связи или на их новое состояние, выражая свое отношение к ее семантике (согласиться, возразить…) либо блокируя автора какой-либо связи

  • Система будет рассылать автоматические оповещения, когда созданная или изменившаяся связь или ИО станут доступными пользователям, т.е. после предварительного одобрения их модератором Соционет

  • Модератор контролирует только соблюдение научной этики.



Создание механизмов сбора и накопления наукометрической статистики с учетом семантических связей основано на развитии существующих наукометрических сервисов системы Соционет

  • Создание механизмов сбора и накопления наукометрической статистики с учетом семантических связей основано на развитии существующих наукометрических сервисов системы Соционет

  • Наукометрия будет формироваться дифференцированно по семантическим характеристикам связей и типам ИО (статей, монографий, презентаций докладов, авторефератов диссертаций и др.), а также по авторам и исследовательским организациям.

  • Будут формироваться также и агрегированные данные

  • Предусматриваются средства анализа топологии структуры связей в информационном пространстве системы (близкие проблемы решаются, например, в проекте SciVal компании Elsevier на основе индекса цитирования Scopus).



Разработка обсуждаемой технологии обеспечивает:

  • Разработка обсуждаемой технологии обеспечивает:

    • визуальный и программный анализ семантической структуры корпуса публикаций в ЭБ
    • новые возможности доступа к ее информационным ресурсам путем визуальной навигации по слоям семантической структуры
    • качественно новые виды наукометрических измерений на основе классификации связей с помощью разработанных онтологий
    • возможности получения информации о развитии научных знаний в конкретных областях исследований и о вкладе отдельных ученых
    • развитые возможности поддержки «живых» документов
    • новые онлайновые формы коммуникаций исследователей и научной деятельности в исследовательском сообществе.


Хотя реализация предлагаемой технологии и семантическое структурирование контента ЭБ требуют заметных трудозатрат, благодаря этому обеспечиваются важные новые функциональные возможности ЭБ

  • Хотя реализация предлагаемой технологии и семантическое структурирование контента ЭБ требуют заметных трудозатрат, благодаря этому обеспечиваются важные новые функциональные возможности ЭБ

  • Применение предлагаемой технологии:

    • существенно повысит эффективность использования накопленного корпуса знаний
    • будет мотивировать повышение исследовательской активности научного сообщества
    • Электронные библиотеки, обладающие рассмотренными возможностями, трансформируются в виртуальные исследовательские среды.