КаталогИндекс раздела

А.С.Деревянко
Консолидированная информация. Введение

Тезисы доклада на установочном заседании семинара "Консолидированная информация" 5.12.2006

Как известно, кафедра "Информатика и интеллектуальная собственность" открывает новую специальность "Консолидированная информация". Хотя поначалу мы относились к этой специальности несколько настороженно, проведя более подробный анализ, мы пришли к выводу о том, что содержание этой специальности полностью соответствует тому, что мы до сих пор делали в преподавании информационных технологий, и, что еще более важно, тем направлениям, в которых мы собирались развивать наши учебные планы и программы.

Специальность "Консолидированная информация" уже введена в некоторых вузах Харькова, но читается в них в рамках социальной информатики. В соответствии с этим, наши коллеги видят основные задачи деятельности специалиста данной специальности в проектировании информационных потоков, систем организации взаимодействия персонала, стратегических планов развития организации. В части технических и программных средств выполнения этих задач упоминаются ПК и аналитические пакеты. Судя по всему, наши коллеги имеют в виду подготовку пользователя консолидированной информации, анализирующего и интерпретирующего ее. Ничуть не сомневаясь в актуальности подготовки специалистов такого профиля, мы, однако, замечаем, что в значительной степени остается вне сферы внимания вопрос о том, как искать информацию, которой предстоит стать консолидированной, как собирать ее, хранить, управлять ею. Между тем, решение этих вопросов является необходимой предпосылкой для работы аналитика. Созданием и развитием программного обеспечения, помогающего решать эти вопросы, занимаются фирмы - лидеры в сфере информационных технологий. Более того, можно без преувеличения сказать, что программное обеспечение для управления консолидированной информацией является передним краем развития ИТ и той областью, в которой разгорается наиболее острая конкурентная борьба. Поэтому мы считаем совершенно необходимым наряду с подготовкой специалистов, использующих консолидированную информацию, подготовку специалистов, управляющих консолидированной информацией с применением широкого спектра программных средств, такое управление поддерживающих.

Уточним термины. Консолидированная - это собранная в одном месте. Мы, однако, будем различать физическую консолидацию - реально собранную в одном месте информацию и логическую консолидацию - информацию, возможно, распределенную, но с точки зрения пользователя находящуюся в едином хранилище, имеющую общий каталог и единообразный доступ к ней. Наши коллеги из сферы социальной информатики, безусловно, имеют в виду логическую консолидацию, и мы вслед за ними трактуем название специальности именно так. В сфере ИТ, однако, логически консолидированная информация чаще называется федеративной и, говоря о программных средствах, мы будем применять этот термин.

Для классификации информации и задач управления ею используем рисунок, приведенный ниже.

Мы уже говорили о разнице между консолидированной (физически) и федеративной информацией. С точки же зрения структуры информацию принято подразделять на данные и контент. Исторически сложилось так, что в сфере ИТ под термином данные часто понимают структурированные данные, причем, структурированные в соответствии с реляционной моделью. (К сожалению, из-за "широкого" и "узкого" толкований термина "данные" порой возникает путаница.) Неструктурированные (или имеющие структуру, отличную от реляционной) данные называют контентом.

Естественно, что исторически управление информации в ИТ началось с управления консолидированными структурированными данными, и основными средствами такого управления на сегодняшний день являются СУБД. Традиционная задача СУБД - управление транзакциями в реальном времени (и типовая программа курса баз данных почти исключительно ограничивается этой задачей). Однако уже давно современные СУБД обеспечивают решение и таких задач, как аналитика в реальном масштабе времени, построение хранилищ данных и добыча данных. Индустрия СУБД имеет уже 25-летнюю историю и естественно, что именно в этих программных средствах (или в сочетании их с другими средствами) осваивается и решение новых задач, связанных с неконсолидированной и/или неструктурированной информацией.

Следующей задачей, которую решают современные СУБД, является поддержка федеративных баз данных - представление данных, хранящихся в разных местах и, возможно, в разных СУБД как единой базы данных.

Потребности современных информационных систем, однако, уже вышли за рамки структурированной информации и требуют возможности работы с такими данными (контентом), как полнотекстовые документы, мультимедийные файлы и т.д., и т.п. При решении задачи управления контентом обычно средства СУБД используются для хранения и представления метаинформации о контенте, тогда как сами составляющие контента хранятся в собственных форматах.

Наконец, управление неструктурированной и федеративной информацией порождает задачу интеграции информации, которую можно считать синонимом логической консолидации. Для решения этой задачи особое значение приобретает средство универсального представления данных, которое было бы переносимо между всеми аппаратными и программными платформами и средствами. Таким средством в последние годы становится язык XML.

Следует отметить, что приведенная нами классификация не является четкой. В самом деле, как отличить консолидированную информацию от распределенной. Наверняка распределенной является информация, разнесенная по разным узлам Web. А разнесенная по разным узлам intranet? А разнесенная по разным узлам локальной сети? А разнесенная по разным носителям в пределах одного узла?

Но задача интеграции-консолидации не исчерпывается только вопросами управления данными/контентом. Интеграция должна быть комплексной. Интегрироваться должна информация, бизнес-процессы, аппаратные средства, программные средства, люди.

Интеграция аппаратных средств не является (к сожалению!) сферой нашей деятельности и предметом подробного рассмотрения. Отметим только, что основным средством решения этой задачи является виртуализация ресурсов, которая реализуется по двум противоположным направлениям. С одной стороны, возможно разделение ресурсов одной вычислительной на несколько виртуальных вычислительных систем, в каждой из которых может обеспечиваться своя операционная среда. Это концепция "консолидации серверов", позволяющая физически консолидировать на одной вычислительной системе задачи и данные, требующие разных сред. С другой стороны, возможно представление ресурсов, находящихся в разных узлах сети (возможно, глобальной сети) как единой вычислительной системы. Это концепция "вычислений по требованию", позволяющая динамически "собирать" виртуальную систему именно такой мощности, какая требуется для решения конкретной задачи.

Интеграция бизнес-процессов состоит в разработке компонентной структуры бизнес-процессов. То есть, бизнес-процесс должен быть представлен как поток выполнения компонентов. Каждый компонент предоставляет пользователю какую-то информацию или выполняет обработку информации (переводит ее из одного целостного состояния в другое, целостное же). Компоненты обладают свойством повторной используемости, то есть, один и тот же компонент может использоваться в разных бизнес-процессах. В масштабах предприятия чрезвычайно важным представляется выполнение одной и той же "подзадачи" в разных бизнес-процессах одним и тем же компонентом. Это обеспечивает не только экономию средств при последующей реализации средствами ИТ, но и (что более важно) единообразие обработки в масштабе всего предприятия.

Интеграция программных средств - задача наиболее сложная, поскольку именно программные средства обеспечивают интеграцию всех остальных составляющих. Продолжая здесь тему интеграции бизнес-процессов, скажем, что программные средства, реализующие компоненты бизнес-процессов, оформляются как сервисы. Сервис - это программный компонент, реализующий законченную функцию предоставления или обработки данных и имеющий строго определенный (стандартный) платформенно-независимый интерфейс. Существенно то, что потребитель сервиса не обязан знать, на каком языке написан сервис, на какой платформе он выполняется, где он находится, - ничего, кроме его интерфейса. Стандартом сервисно-ориентированной архитектуры являются открытые стандарты Web-сервисов (SOAP, WSDL, UDDI), базирующиеся на языке XML. Свойства сервисно-ориентированной архитектуры дают возможность не только повторного использования компонентов, разработанных как сервисы, но использования ранее созданных, "унаследованных" компонентов путем создания для них "оберток", приводящих их интерфейсы к стандартам сервисов. После представления бизнес-процессов в виде сервисов программные средства обеспечивают "хореографию бизнес-процессов" - последовательность обращений к сервисам, реализующую поток выполнения компонентов процесса.

Унифицированный способ описания сервиса (WSDL), унификация ведения реестров сервисов (UDDI) и унифицированный протокол взаимодействия сервиса и его потребителя (SOAP) делают возможным взаимодействие любого потребителя с любым сервисом. Расширением этой возможности является концепция единой Сервисной Шины Предприятия (ESB), заменяющая схему соединений P2P на топологию звезды. Программное обеспечение ESB производит маршрутизацию сообщений, согласование протоколов, форматов и т.п.

Интеграция информации происходит под лозунгом "информация - это сервис". То есть, с точки зрения потребителя информации не существует хранилищ информации, форматов и структур ее хранения, а существует только сервис, доставляющий ему ту информацию, которую он затребовал в том формате, который он заказал. Все детали хранения и структурирования информации, о которых мы говорили выше, скрываются под стандартной оболочкой сервиса.

Интеграция людей включает в себя как обеспечение доступа к интегрированной информации каждого отдельного участника бизнес-процесса, так и обеспечение совместной работы участников.

Отнесем к этой составляющей интеграции прежде всего обеспечение рабочего места участника бизнес-процесса. Такое рабочее место должно интегрировать доступа к необходимой для пользователя информации и средствам ее обработки, то есть предоставлять для своего пользователя единую точку доступа к данным и функциям системы. Рабочие места такого рода строятся как порталы - мозаичные панели, содержащие в себе вложенные зоны или окна (необязательно явно выделенные в общей панели портала). Содержимое каждой такой зоны/вложенного окна формируется отдельным приложением; причем обеспечивающие работу портала приложения, с одной стороны независимы друг от друга, а с другой, могут легко обмениваться данными и синхронизировать свою работу. Портал должен быть настраиваемым, персонализируемым для потребностей конкретного пользователя в зависимости от его роли в бизнес-процессе. Наиболее развитой является технология Web-порталов, в которой панелью портала является окно Web-браузера, и никакого дополнительного программного обеспечения на рабочем месте не требуется. Функционирование Web-портала обеспечивается выполняющимися на сервере программами-портлетами. Выполнение же портлетов поддерживается сервером приложений. Поскольку спецификации портлетов, как и все другие спецификации J2EE и Java, являются открытыми, портлеты могут выполняться в любом сервере J2EE.

Менее развито оформление в виде порталов "толстых" клиентов и локальных приложений. В последние годы, однако, появилась технология Eclipse Rich Client, которая ориентирована на построение именно таких приложений. Информация в каждой зоне панели (представлении - в терминах Eclipse) отображается отдельным локальным приложением. Технология, однако, предусматривает связь с сервером и возможность автоматического обновления локального приложения при изменении его эталонной версии на сервере.

Другой составляющей интеграции людей является обеспечение совместной работы виртуальных команд - общего документооборота, общего календаря, электронной почты, доски объявлений, виртуальных конференций и т.д., и т.п. Традиционно такие средства обеспечивались отдельным программным обеспечением - серверами приложений для коллективной работы, однако, сейчас имеется тенденция интеграции таких серверов с программным обеспечением рабочих мест и включение средств командных коммуникаций в панель портлета.

Для предприятия с большим объемом информации и разнообразными задачами деятельности в бизнес-процессах участвует множество компонент, поддерживаемых множеством разнообразных аппаратных средств и разнообразного программного обеспечения. Поэтому чрезвычайно важной является задача единого управления ресурсами интегрированной системы. Программное обеспечение, обеспечивающее такое управление, применяет концепцию виртуализации, сходную с "вычислениями по требованию", представляя в виде единой перспективы все аппаратные и программные ресурсы, участвующие в выполнении одного бизнес-процесса, независимо от того, где эти ресурсы размещены физически.

Представленная выше концепция интегрированной информации составлена преимущественно по материалам фирмы IBM, однако нет существенных отличий в представлении ее другими фирмами (Oracle, BEA, Microsoft, Sun, etc.). Наша ориентация на IBM хорошо известна и временами вызывает непонимание у наших коллег в свете тех заблуждений, что продукты IBM во-первых, "тяжеловесны", во-вторых, не пользуются популярностью в нашей стране. Стоит сказать несколько слов в обоснование нашей позиции.

  1. IBM занимает одно из первых в мире и первое в отрасли ИТ место по объемам вложений в исследования и разработки.
  2. На протяжении ряда последних лет IBM занимает первое место в мире по количество ежегодно получаемых патентов, а если рассматривать только сферу ИТ, то IBM получает ежегодно больше патентов, чем фирмы, занимающие несколько следующих мест вместе взятые.
  3. IBM выпускает полный спектр аппаратных решений и программных продуктов для всех направлений интеграции информации в рамках электронного бизнеса. По оценкам экспертных фирм Gartner Group и IDC, учитывающим множество факторов, связанных как с рыночной стабильностью, так и с инновационной деятельностью фирм, IBM по всем этим направлениям занимает либо первое, либо одно из первых мест. Ни одна другая фирма не может похвастаться таким стабильным лидерством по всем направлениям.

Таким образом, ориентация на IBM является ориентацией на лидера в отрасли - аргумент, на наш взгляд, довольно весомый.

Что касается "тяжеловесности" продуктов IBM, то, мы рассчитываем (и это подтверждается пусть небольшим, но уже имеющимся у нас опытом), на то, что наши выпускники будут работать с продуктами корпоративного масштаба; не IBM, так Oracle, BEA, Sun, а никакие из этих продуктов "легковесными" не назовешь. Важным аргументом является ориентация IBM на открытые стандарты. Это означает, что продукты IBM в информационных системах могут работать совместно с продуктами других производителей и что опыт, полученный на продуктах IBM, может быть применен в работе с продуктами других фирм.

Наконец, в ноябре 2005 года мы были свидетелями многозначительного "прокола" фирмы IBM в организации в Киеве семинара, посвященного управлению данными. Прокол состоял в том, что на семинар прибыло значительно больше участников, чем рассчитывало украинское представительство фирмы. По рассказам очевидцев, в еще большей степени подобный прокол проявился на проходившей неделей ранее конференции, посвященной Linux. Досадные сами по себе, эти проколы, однако, свидетельствуют о появлении в нашей стране потребителей корпоративных ИТ и о растущем интересе таких потребителей к продуктам фирмы IBM.

 

Концепция интеграции в том виде, в каком она здесь представлена, сложилась относительно недавно. Но с самого начала деятельности нашей кафедры значительная часть нашего учебного плана и программ наших курсов вписывались в общую концепцию интеграции информации. К таковым можно отнести достаточно глубокое (пусть преимущественно в рамках OLTP) изучение технологий баз данных, изучение средств моделирование бизнес-процессов, платформы Java и J2EE. В последний год мы внедряем в программы учебных курсов изучение платформы Eclipse и технологий XML, в частности, Web-сервисов. На очереди - технология Eclipse Ritch Client Web-порталы.

Таким образом, концепция интеграции может служить цементирующим и направляющим фактором для наших программ и планов независимо от того, насколько успешным будет введение новой специальности.


КаталогИндекс раздела