Лекция 26. Информация об информации. Метаданные. 
           Индустрия информации и знаний. Онтологии и Semantic WEB.	
http://www.cdclub.pp.ru/index.php?body=patch		

Метаданные - данные о данных: 
   каталоги, справочники, реестры, базы метаданных, содержащие сведения о 
составе данных, содержании, статусе, происхождении, местонахождении, качестве,
форматах и формах:
 Метаданные - данные о данных: каталоги, справочники, реестры, базы метаданных, 
содержащие сведения о составе данных, содержании, статусе, происхождении, 
местонахождении, качестве, форматах и формах представления, условиях доступа, 
приобретения и использования, авторских, имущественных и смежных с ними правах 
на данные и др. 
   Версионность метаданных - это механизм, позволяющий динамически менять 
структуру таблиц БД, не затрагивая данные, хранящиеся в этих таблицах. 

  http://ngo.org.ru/ngoss/support/MetadataForDummies.shtml
  В Интернете содержится огромное количество документов, настолько огромное, 
что на первый план выходит не проблема собственно наличия документа в Интернете, 
а проблема поиска нужного документа. И здесь единственная возможность облегчения
ситуации - научить компьютер понимать документы, т.е. существенная тенденция 
современного развития Интернет - это переход от документов, читаемых 
компьютером (machine readable) к докумаентам, понимаемым компьютером 
(machine understandable).
   Документ содержит дополнительную информацию, которая характеризует его. В 
простейшем случае - это информация о дизайне документа (шрифты и их размер, 
отступы и т.д.). Метаданные (metadata) - это информация о документе, понимаемая 
компьютером (machine understandable). "Понимание компьютером" есть ключевой 
момент в определении метаданных. Человек смотрит на документ и видит его 
заголовок, в котором указано название документа. Подзаголовок может содержать 
тему документа, а также его краткую аннотацию. Обычно где-то в самом начале 
документа или в самом его конце указан автор (или авторы)... Таким образом, 
бегло взглянув на документ (и потратив обычно несколько секунд), человек 
получает дополнительную информацию о документе и после этого делает вывод: 
тот это документ, который ему нужен, или нет; читать ли сам текст, содержимое 
(content) документа или нет. Если бы машина могла также легко понять, какая 
тема документа, кто его автор и когда он создал этот документ и т.д., тогда 
реально можно охарактеризовать и автоматически искать документ по большому 
числу признаков. Если машина не понимает документ, то она принципиально может 
искать только по словам, содержащимся в документах.

  Модель
 Научить машины понимать контекст, т.е. анализировать его структуру также, как 
это делает человек - дело будущего, да и при этом узнать, например, кто автор 
документа, можно только в том случае, если в тексте документа это явно указано 
каким-либо способом. Если ресурс (объект описания) достаточно сложный, имеет 
разнообразные характеристики (атрибуты, свойства), состоит из нескольких 
частей (которые в свою очередь тоже можно считать объектами...), определённым 
образом связанных между собой, то интуитивно понятно, что для достаточно
подробного описания такого документа метаданные тоже будут иметь сложную 
структуру. Поэтому одна из задач создания метаданных - разработка модели 
описания метаданных, т.е. выработка общего формального подхода, логики 
описания объектов, их свойств и связей между объектами.
   На сегодняшний день наиболее перспективной и общеупотребительной моделью 
описания медатанных является система RDF (Resource Description Framework), 
созданная международной организацией W3C (World Wide Web Consorcium) при 
участии представителей различных заинтересованных организаций (см. Resource 
Description Framework (RDF) Model and Syntax Specification ).

Набор элементов
    Однако модель - это только скелет описания. Для того, чтобы практически 
описать хотя бы самые простые атрибуты документа (Название, Автор, Ключевые 
слова...) нужно дать этим атрибутам названия, которые потом будут использоваться 
во всём мире. В противном случае один автор напишет "Название: Метаданные для 
экономистов", другой: "Заголовок: Метаданные для экономистов", а третий "Title: 
Метаданные для экономистов" - и видно, что мы ещё не получили единого подхода.
   В настоящее время наиболее распространённым наборов элементов для создания 
метаданных является набор, создаваемый уже в течение нескольких лет 
международной группой "The Dublin Core initiative". Этот набор называется, 
естественно, "Dublin Core Metadata Elements" и состоит из 15 элементов (см. 
RFC2413, Dublin Core Metadata for Resource Discovery ). Как указывается в 
RFC2413, эти элементы можно условно разбить на три группы:
1. Content - элементы, в основном относящиеся к содержанию ресурса;
2. Intellectual Property - элементы, в основном рассматриваемые с позиции 
интеллектуальной собственности;
3. Instantiation - элементы, в основном относящиеся к данному экземпляру 
ресурса. 

Content            
	Title 
        Subject 
	Description 
	Type		
	Source   
	Relation   
	Coverage 
Intellectual Property  
	Creator
	Publisher 
	Contributor 
	Rights 
Instantiation 
	Date 
	Format 
	Identifier 
	Language 

  Пятнадцати элементов явно не достаточно для информационных систем типа 
электронных библиотек. Для того, чтобы сохранить совместимость с простейшим 
описанием из 15 элементов и, в то же время, увеличить детализацию и сложность 
описаний различные организации, в том числе и рабочие группы самой The Dublin 
Core Initiative, разрабатывают расширения, дополнительные квалификаторы для 
базовых элементов. Два наиболее часто цитируемых предложения:
1. "Dublin Core Qualifiers/Substructure автор: Rebecca Guenther" и
2. "Dublin Core qualifiers", созданный в рамках проекта ROADS.
   И наконец, недавно появилось предложение The Dublin Core Initiative:
"Guidance on expressing the Dublin Core within the Resource Description 
Framework (RDF)". 
     Расширять сам набор элементов можно с использованием уже имеющихся 
стандартов. Например, для описания людей и организаций (выступающих в качестве 
Creator, Publisher или Contributor) можно применить стандарт для электронных 
бизнес-карт (vCard). Общие соображения по этому поводу даёт Diane I. Hillmann 
в Names in Dublin Core , а конкретное предложение - Renato Iannella в 
Representing vCard v3.0 in RDF. Кстати, NGOSS полностью использует это 
предложение. ... А сам стандарт vCard -это тоже не дитя без родителей, а 
(всего-то) первая Интернет-реализация протокола директорий X.500. 
  Подробно элементы, принятые в NGOSS, описаны в документе: Набор элементов
метаданных "Электронной библиотеки НКО": Описание

Словари 
   Для того, чтобы классификация ресурсов приносила пользу, мало выбрать модель
и набор элементов-характеристик. ОЧЕНЬ желательно ещё, оказывается, конкретные 
значения этих характеристик не просто писать из головы и в любой форме, а 
выбирать из общих словарей (словников, тезаурусов) и записывать в понятной для 
всех форме. Например, формат даты и времени должен быть универсальным. Это 
просто: предлагается использовать Date and Time Formats . 

The formats are as follows. Exactly the components shown here must be present,
with exactly this punctuation. Note that the "T" appears literally in the 
string, to indicate the beginning of the time element, as specified in ISO 8601. 
   Year:
      YYYY (eg 1997)
   Year and month:
      YYYY-MM (eg 1997-07)
   Complete date:
      YYYY-MM-DD (eg 1997-07-16)
   Complete date plus hours and minutes:
      YYYY-MM-DDThh:mmTZD (eg 1997-07-16T19:20+01:00)
   Complete date plus hours, minutes and seconds:
      YYYY-MM-DDThh:mm:ssTZD (eg 1997-07-16T19:20:30+01:00)
   Complete date plus hours, minutes, seconds and a decimal fraction of a
second
      YYYY-MM-DDThh:mm:ss.sTZD (eg 1997-07-16T19:20:30.45+01:00)
where:
     YYYY = four-digit year
     MM   = two-digit month (01=January, etc.)
     DD   = two-digit day of month (01 through 31)
     hh   = two digits of hour (00 through 23) (am/pm NOT allowed)
     mm   = two digits of minute (00 through 59)
     ss   = two digits of second (00 through 59)
     s    = one or more digits representing a decimal fraction of a second
     TZD  = time zone designator (Z or +hh:mm or -hh:mm)
   Если информационная система хочет иметь возможность выбирать ресурсы по 
географическим характеристикам, то нужен общепринятый словарь (тезаурус) 
географических названий. Им может быть, например, The Getty Thesaurus of 
Geographic Names (TGN) , однако для целей использования в России его желательно 
более удобно организовать, используя большее число уровней территориального 
деления. 

Subject (Тема) 
  Очень актуален выбор тезауруса для характеристики предметной области 
(рубрикатора тем). Выбор конкретного, ограниченного по объёму списка облегчает 
поиск информации и улучшает качество поиска. Как хорошо сказано в AGLS User 
Manual , для поиска можно выделить два тезауруса: предметный тезаурус (subject 
tesaurus) и функциональный тезаурус (function thesaurus):
1. Предметный тезаурус содержит понятия предметной области и отражает содержание 
документа, он отвечает на вопрос "о чём этот документ?". В NGOSS этот словарь 
называется просто "Тема" (Theme) и имеет многоуровневую структуру. Термины и 
структура верхних уровней этого словаря, общие для любых применений, 
заимствуются из категорий популярных поисковых систем. Дополнительно 
добавляются термины, специфические для НКО.
2. Функциональный тезаурус отражает роль документа в человеческой деятельности, 
бизнесе и отвечает на вопрос: "для чего этот документ?". В NGOSS для этой цели 
используются словарь "Виды деятельности" (Deed) - отражает виды деятельности и 
предоставляемые услуги. 

Состав и структуру указанных словарей можно увидеть, установив флажок "структура" 
на основной странице библиотеки (попробуем). 

Type (Тип) 
Тип ресурса отражает жанр, категорию его содержания. Минимальный список, 
представленный в Resource Types for Simple Dublin Core включает следующие 
элементы: 

text 
image 
sound 
dataset 
software 
interactive 
event 
physical object 
   Этот список может быть расширен (каждый элемент делится над подэлементы), 
например event (событие, в более узком смысле - мероприятие) может быть 
конкретизирован следующим образом:

Конференция 
Семинар 
Круглый стол 
Выставка 
Проект 
Coverage (Охват) 
В качестве значений этого элемента NGOSS использует два контролируемых словаря 
(controllable vocabulary) для классификации:
1. Region (Регион) - характеризует место, о котором рассказывается в документе; 
место, в котором проводится мероприятие и т.д.
2. Target (Целевая аудитория) - конкретизирует: для кого этот документ или для 
работы с кем он может быть использован (intended audience). 

Format (Формат)
Формат отражает среду, формат данных ресурса; материал, из которого состоит 
ресурс (если это физический объект), и, возможно, его физические размеры. 

Если описываемый ресурс представлен в электронном виде, то его формат определяет 
способ работы с ним, программное обеспечение. 

Формат электронного документа рекомендуется выбирать из списка Internet Media 
Types (MIME), где это возможно. Примеры электронных форматов:
text/xml - текст в формате XML
text/plain - текст без форматирования
image/gif - рисунок в формате GIF 

Для других ресурсов формат нужно выбирать из списка физических объектов, 
например из Art and Architecture Thesaurus (AAT). (См. Format Element for 
Simple Dublin Core ). 

Размещение метаданных 
Как отмечается в [RDF], метаданные могут быть встроены (embedded) в сам ресурс, 
например в HTML страницу (это самый простой подход для описания страниц), а 
могут хранится и обновляться независимо от ресурсов. Второй подход более 
универсален, потому что в этом случае метаданные могут быть созданы для любого 
ресурса (например, для человека или организации). 

В случае размещения метаданных отдельно от ресурса сами метаданные 
предпочтительно хранить (и передавать) в формате XML. При этом максимально
используются возможности модели RDF и обеспечивается свободный обмен 
информацией (interoperability ). 
  Обмен метаданными сводится к пересылке RDF/XML-файлов (т.е. текстовых файлов 
формата XML или просто ссылок на эти файлы), т.е. может быть полностью 
автоматизирован. Например, можно заранее подготовить описания на группу 
ресурсов, а потом послать их в информационную систему одним письмом (в 
виде attachments). 

Практическая реализация 
Простым пользователям Электронной Библиотеки НКО волноваться нечего: они 
получат возможность удобно создавать описания своих ресурсов, заполняя поля 
в простой форме и, где необходимо, выбирая значения из списков. Полученное 
описание можно будет отправить в ЭБ, а также сохранить у себя для 
самостоятельного использования. 
   Данный проект оказывает помощь также тем организациям, которые создают (или 
хотят создать) собственные информационные системы в соответствии с современными 
международными стандартами. Именно поэтому мы создаём и публикуем техническую 
информацию о нашей информационной системе. Для предоставления всем 
заинтересованным разработчикам возможности использовать единый формат для 
обмена метаданными необходимо создать формальное (однозначное) описание, а 
также, возможно, дополнительные средства для упрощения разработки (например, 
RDF -процессор). Один из самых сложных моментов - отслеживание прогресса в 
изменении международных стандартов и предложений, на базе которых создаётся 
данное описание и которым это описание в любом случае должно соответствовать 
для сохранения доступности. Однако, в рамках бюджета и времени программы NGOSS 
такая разработка затруднена. В качестве альтернативы создаётся шаблон описания 
(пример описания), содержащий минимальные комментарии. Для получения 
дополнительной информации разработчикам необходимо обращаться к первоисточникам. 
  К настоящему моменту разработан и реализован в работающей системе формат 
описания метаданных, предполагаемая рекомендация которого (являющаяся 
одновременно описанием данной страницы,) находится здесь: 
http://ngo.org.ru/ngoss/TR/WD-ngoss-rdf.xml . Вам не стоит пугаться сложности 
этого документа: во-первых - в работающей системе он создаётся автоматически, 
а во-вторых - он специально делается максимально сложным для определения и 
тестирования максимума возможностей системы. Практически обычные описания 
гораздо проще - они не используют сразу два языка, не описывают подробно 
авторов ресурса и т.д.
   Указанием на успешность проделанной работы является то, что ссылка на это 
описание появилась на обзорной странице самого законодателя стандартов Интернет: 
The World Wide Web Consortium, см. http://www.w3.org/RDF/Overview.html 

Литература 
Вопросы и ответы 
An Idiot's Guide to the Resource Description Framework by Renato Iannella 
Что такое RDF? 
О целях и задачах работы с метаданными 
The Australian Government Locator Service (AGLS) Manual for Users 
Руководства по созданию метаданных 
Dublin Core Metadata Initiative / Documents / Working Drafts / User Guide 
Working Draft 1998-07-31 
User Guidelines for Dublin Core creation (Nordic Metadata Project) 
Tasmanian Metadata Guide, Draft 1.4 
Примеры RDF в Resource Description Framework Model and Syntax Specification 
Примеры реализаций 
Australian Government Locator Service 
The Nordic metadata project 
UKOLN: DC-dot, A Dublin Core Generator 
Dublin Core Metadata Template by the Nordic Metadata Project 
IMS Module Type 
Notes on mapping of national libraries' metadata requirements to Dublin Core 
Дополнительные ссылки 
DC Subject. Thesauri and classification systems available in the WWW 
Dave Beckett's Resource Description Framework (RDF) Resources 
The Getty Information Institute: Vocabularies 
Исследования и проекты 
CC:DA Task Force on Metadata and the Cataloging Rules: Final Report 
Dublin Core and the Cataloging Rules с примерами 
ROADS Cataloguing Guidelines 
dc.bot - The ADAM Harvester 
The MetaWeb Project 
The 4th Dublin Core Metadata Workshop Report 
The Warwick Framework - Container Architecture 
A review of metadata: a survey of current resource description formats for 
DESIRE research project 
Стандарты, рекомендации и предложения 
Extensible Markup Language (XML) 1.0; World Wide Web Consortium Recommendation 
Resource Description Framework Model and Syntax Specification; W3C Recommendation 
Guidance on expressing the Dublin Core within the Resource Description 
Framework (RDF); Draft Proposal of the Dublin Core Metadata Initiative 
RFC1766; Tags for the Identification of Languages 
RFC2413; Dublin Core Metadata for Resource Discovery 
RFC2141; URN Syntax 
RFC2396; Uniform Resource Identifiers (URI): Generic Syntax 
Date and Time formats ; W3C Note 
Names in Dublin Core - note by Diane I. Hillmann 
Date Element Working Draft by Dublin Core Metadata Initiative 
Dublin Core qualifiers from ROADS project 
Dublin Core Qualifiers/Substructure by Rebecca Guenther 
Resource Types for Simple Dublin Core 
Format Element for Simple Dublin Core 
Qualified Dublin Core Metadata for Simple Resource Discovery Internet-Draft, 
10 July 1998 
Dublin Core/MARC/GILS Crosswalk by Network Development and MARC Standards 
Office 
Representing vCard v3.0 in RDF draft by Renato Iannella 
RFC2426; vCard MIME Directory Profile 
X500 Directory Standard Home Page 
 
Метаданные ИСИР: определение и использование.
А. Н. Бездушный, А. М. Серебряков, А. А.Филиппова 
Вычислительный центр РАН
Адрес: Москва, ул. Вавилова, 40
Тел. (095)1355471
А. С. Лопатенко 
Центр научных телекоммуникаций и информационных технологий РАН
Адрес: Москва, ул. Губкина, 8
Тел. (095)9383938

Для современных сложных информационных систем необходима поддержка метаданных 
- информации, предназначенной для анализа, дизайна, развития и использования 
информационных систем1. Для систем класса цифровых библиотек, каковой является 
ИСИР РАН (Интегрированная система информационных ресурсов РАН), метаданные 
особо необходимы для задач управления системой, корректного использования и 
понимания данных системы.

С точки зрения ИСИР РАН метаданные делятся на два типа: 
 - метаданные, описывающие информационную, функциональную и другие схемы системы; 
 - метаданные, описывающие информационные ресурсы. 
Остановимся подробнее на каждом из типов метаданных.

Метаданные схемы системы.
   Для описания информационной модели ИСИР РАН используется стандарт Object 
Management Group XML Metadata Interchange (OMG XMI). Этот стандарт позволяет 
описывать классы объектов, представляющие типы информационных ресурсов ИСИР РАН, 
атрибуты и отношения между различными типами ресурсов. 
   Этот стандарт используется в ИСИР РАН для следующих целей:

- система экспорта/импорта данных использует XMI-представление для анализа и 
  понимания информационной модели ИСИР, создания объектного API к ресурсам 
  ИСИР (то есть API, реализующего функции извлечения данных о ресурсах ИСИР и 
  изменения этих ресурсов); 
- в будущем возможно использование CASE-средств, понимающих XMI. Это позволит 
  автоматически настраивать на изменения в модели данных ИСИР другие 
  информационные системы, работающие с ИСИР. 
Стандарт OMG XMI был выбран по следующим причинам: 
стандарт является открытым, получил активную поддержку среди разработчиков 
средств дизайна и CASE средств, в научной общественности; 
стандарт базируется в качестве средства синтаксического представления на XML 
- открытом часто используемом стандарте. Разработчики ИСИР имеют большой опыт 
работы с XML-данными; 
элементы OMG XMI имеют определенную семантику, близкую к семантике элементов 
ИСИР РАН. Мощность метамодели стандарта достаточна для описания схемы данных 
и функциональной модели ИСИР РАН 
Для описания схемы данных ИСИР РАН используется формат OMG Common Warehouse 
Model Interchange, базирующийся на XMI. Этот формат позволяет описывать многие 
аспекты как структуры системы, так и операций трансформации, загрузки и 
выгрузки данных из них. 

Этот формат используется:
 для настройки системы импорта/экспорта данных на схему БД РАН; 
для описания трансформации данных из схемы ИСИР РАН в другие схемы. 
В дальнейшем его использование позволит не менять код систем, работающих с 
ИСИР, а менять только описания БД. Кроме того, многие современные производители 
и разработчики РСУБД и решений хранилищ данных начинают использовать этот 
стандарт, что позволит использовать эти технологии в качестве средств 
проектирования и разработки ИСИР РАН.

Данный стандарт был выбран по следующим причинам:
стандарт получил широкую поддержку среди разработчиков РСУБД и производителей 
 ПО в близких к РСУБД областях (Date Warehousing, OLAP); 
стандарт имеет метамодель для представления данных о реляционных схемах, 
 достаточную для полного описания базы данных ИСИР РАН, за исключением 
 особенностей, свойственных реализациям на конкретных РСУБД. Для описания 
 таких возможностей планируется создавать расширения CWM; 
стандарт имеет метамодель, достаточную для решения базовых задач обмена данными 
 ИСИР РАН. Для решения сложных задач разработаны его расширения; 
стандарт базируется на XML. Преимущества использования XML описаны выше; 
модель данного стандарта близка к модели другого популярного стандарта для 
 описания моделей данных, реляционных схем, схем обмена данными и др. - 
 Metadata Coalition Open Informational Model (MDC OIM). В будущем это позволит 
 выражать схему ИСИР в MDC OIM и использовать для хранения метаданных 
 распространенные репозитории. 
Прототип системы обмена данными выполняет задачи настраиваемого представления 
данных ИСИР в виде объектного API, экспорта данных ИСИР из БД в 
XML/RDF-представление (база данных - источник, XML/RDF - приемник данных). 
Данный прототип в настоящее время реализован на языке Java с использованием 
технологии Enterprise JavaBeans. 

   Данный прототип позволяет экспортировать информационные ресурсы в следующие 
модели данных:
разработанное специально для ИСИР XML-представление информационных ресурсов; 
разработанное специально для ИСИР RDF-представление информационных ресурсов 
 (это представление согласованно между БЕН и ИСИР РАН). 
При экспорте для выражения семантики могут быть использованы различные  стандарты.

К настоящему моменту система настроена на:
Open Archives Metadata Set (OAMS) представления данных о e-print (Santa Fe 
 convention Open Archives Initiative); 
DC (Dublin Core - международная инициатива представления данных о публикациях); 
vCard (электронная визитная карточка); 
CERIF (европейская инициатива формата описания проектов); 
собственное пространство имен. 
Метаданные ресурсов.

При разработке модели данных ИСИР РАН одними из основных требований к ней были:
возможность адекватного представления информации, относящейся к Российской 
Академии Наук; 
интероперабельность с другими системами, содержащими аналогичную информацию. 
   С учетом этих требований, в модель были включены ресурсы следующих типов: 
"организация", "персона", "проект" и "публикация". Разработка структуры 
ресурсов требует определения характерных свойств каждой информационной сущности, 
достаточно полно описывающих ее. Эта задача усложняется требованием 
интероперабельности. Обеспечение интероперабельности является одной из 
наиболее важных задач, так как значительные информационные ресурсы уже 
представлены в цифровом виде, и основная проблема, возникающая при их 
использовании, заключается в отсутствии связей между ними. Для обеспечения 
взаимодействия с широким кругом информационных систем необходимо, чтобы модель 
была совместима с общепринятыми стандартами представления данных. Нами были 
изучены предложения и стандарты метаописания информационных ресурсов, 
представленных в ИСИР РАН, например: Dublin Core, MARC, GILS, CERIF, vCard.

В качестве основы для реализации ресурса "публикация" из множества имеющихся 
вариантов был выбран Dublin Core. Этот выбор обусловлен следующими 
преимуществами этого стандарта:
 набор основных семантических элементов компактен и, в то же время, позволяет 
  задавать практически все требуемые атрибуты; 
семантика каждого элемента может быть уточнена с помощью квалификаторов, как 
стандартных, известных и понятных всем, так и специально разработанных для 
точной спецификации семантического смысла определенного атрибута при обмене 
данными внутри небольшого сообщества; 
в стандарте заложена возможность использования различных семантических схем, 
словарей и т. п. 
определен механизм, позволяющий извлечь информацию из описания, использующего 
нестандартные расширения пространства имен; 
стандарт получает все более широкое распространение в мировом сообществе. 
Модель данных публикации ИСИР РАН позволяет задавать любой базовый элемент 
Dublin Core (Заглавие, Автор и т. д.). Предусмотрена возможность использования 
квалификаторов, уточняющих семантику базовых элементов (например, Параллельное 
заглавие, Участник-Редактор и т. п.). Это позволяет достаточно легко 
обмениваться библиографической информацией на основе этого стандарта. Однако 
серьезным препятствием для интероперабельности этой подсхемы модели ИСИР РАН 
с другими системами является то обстоятельство, что большинство этих систем 
рассматривает отдельные свойства публикаций, такие как "автор", "издатель", 
"источник", как обычные текстовые атрибуты, в то время как они, по сути, 
являются связями с другими сущностями (персонами, организациями, публикациями).
    Такие модели не противоречит Dublin Core, но приводит к определенной 
несовместимости их с моделью ИСИР РАН и, в частности, к неоднозначности при 
интеграции данных в систему.
   Для представления информации о научных проектах предназначен стандарт CERIF. 
Он основан на модели данных, которая включает сущности "проект", "организация" 
и "персона", связи между ними, а также атрибуты этих сущностей. Стандартом 
определяется три уровня детализации при описании ресурсов:

Полное описание ресурсов - содержит расширенный набор атрибутов, позволяющий 
описывать различные схемы ресурсов; 
Набор атрибутов для осуществления обмена данными между различными системами; 
Сокращенный набор атрибутов - метаописание ресурсов. 
В модели ИСИР РАН ресурс "проект" имеет следующие свойства: даты начала и 
окончания проекта, код проекта, тип, ключевые слова, описание. Также в нее 
включена связь "участник" между проектом и организацией/персоной, имеющая 
атрибут "тип участия". Таким образом, взаимодействие с другими системами на 
основе CERIF реализуется достаточно легко. Тем не менее, в настоящий момент 
стандарт реализован в ограниченном варианте (так, в ИСИР РАН не определено 
понятие "результат проекта"), и модель ресурса "проект" будет развиваться. 
    Примечательно, что модель данных, предлагаемая CERIF, явно определяет 
персоналии и организации как самостоятельные сущности, что хорошо согласуется 
с моделью ИСИР РАН и делает информационный обмен еще проще.

     Для представления информации о персоналиях существует значительное 
количество форматов. Тем не менее, достаточно широко используется только 
стандарт vCard, разработанный для унификации обмена данными между программными 
приложениями и информационными системами. Основными понятиями формата являются: 
поток данных и объект vCard. Поток данных - это набор vCard-объектов, которым 
обмениваются системы. vCard-объект - это набор предопределенных атрибутов, 
описывающих некоторый ресурс. Атрибут определяется своим именем, возможно, 
набором параметров, и значением. Параметры конкретизируют значение атрибута 
- например, для атрибута "телефон" параметры уточняют его значение: домашний, 
рабочий. Набор элементов и их параметров четко определен в стандарте и не 
расширяем. Формат позволяет создавать "электронные визитные карточки" для 
объектов типа персона.

   Однако после анализа имеющихся данных было установлено, что семантика vCard 
недостаточна для представления всех необходимых атрибутов. Например, научная 
степень и академический статус персоны не имеют семантически близких элементов 
в vCard. В связи с этим, модели ресурсов "персона" и "организация" были 
разработаны так, чтобы максимально точно сохранить модель, лежащую в основе 
имевшихся исходных данных. Ресурс типа "организация" имеет атрибуты: название, 
аббревиатура, адрес, телефон, электронный адрес, вид организации, направление 
деятельности, историческая справка, схема проезда, ключевые слова, фотография. 
   Ресурс типа "персона" обладает атрибутами: фамилия, имя, отчество, научная 
степень, научное звание, академический статус, специальность ВАК, ключевые 
слова, направление деятельности, фотография. Кроме того, между этими типами 
ресурсов установлена связь "должность", обладающую атрибутами: название, вид, 
телефон, электронный адрес.
   Основная цель поддержки vCard - экспорт данных в формате, понятном большому
числу систем. В настоящий момент выполняется экспорт ограниченного набора 
атрибутов. В дальнейшем этот набор будет расширен, а также реализована 
возможность импорта данных из этого формата.
   Следует отметить, что каждый стандарт предлагает собственную модель данных,
часто и собственный синтаксис для записи информации. Подход ИСИР РАН 
заключается в использовании для обмена метаданными единой модели данных и 
синтаксиса, определяемых RDF2. Только семантика атрибутов тех или иных 
ресурсов берется из соответствующего стандарта. Если найти подходящий 
элемент в стандартных пространствах имен не удается, можно создать собственное 
пространство, определив его посредством URI, и добавлять в него элементы с 
требуемой семантикой. Такой подход значительно упрощает взаимодействие между 
ИСИР РАН и другими системами.

Заключение.
   В ИСИР разработана технология обмена данными с внешними системами, 
основанная на международных стандартах представления метаданных, включающая в 
себя общую модель данных и средства импорта/экспорта данных.

Ввод пароля
<body>                        
<form action="mailto:Zosja@www.Roga and_Copyta.com">
К какой возрастной группе вы относитесь?<br> <br>         
<input type=radio name=age value="0-12"> до 16 <br>                       
<input type=radio name=age value="13-17">от 17 до 23<br>                   
<input type^radio name=age value="18-25">от 24 до 30<br>
<input type=radio name=age value="26-35" checked> от 31 до 40<br>               
<input type^radio name=age value="36-">после 41<br>
</form>
</body>