автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему: Разработка комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии и химической технологии
Автореферат диссертации по теме "Разработка комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии и химической технологии"
На правах рукописи
Кульков Сергей Сергеевич
Разработка комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии и химической технологии
Системный анализ, управление и обработка информации (химическая технология, нефтехимия и нефтепереработка, биотехнология)
05.13.18 - Математическое моделирование, численные методы и комплексы программ (технические науки)
Диссертации на соискание ученой степени Кандидата технических наук
Работа выполнена на кафедре кибернетики химико-технологических продессов Российского химико-технологического университета (РХТУ) им. Д.И. Менделеева
Научные руководители: доктор технических наук, профессор Кольцова Элеонора Моисеевна кандидат технических наук, доцент Павличева Елена Николаевна
Официальные оппоненты: доктор физико-математических наук, профессор Малпнецкий Георгий Геннадьевич
заместитель директора по научной работе института прикладной математики им. М.В. Келдыша Российской академии наук
кандидат технических наук, доцент Дударов Сергей Павлович
доцент кафедры компьютерно-интегрированных систем в химической технологии РХТУ им. Д.И. Менделеева
Ведущая организация: Государственная научно-техническая библиотека России
Защита состоится «27 »сентября 2007 г. в 13 часов в конференц-зале на заседании диссертационного совета Д 212.204.03 в РХТУ им. Д.И. Менделеева по адресу: 125047, г. Москва, Миусская пл., д.9
С диссертацией можно ознакомиться в Информационно-библиотечном центре РХТУ им. Д.И. Менделеева
Автореферат разослан «25» августа 2007 г.
Ученый секретарь Диссертационного совета Д 212.204.03
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальпость работы. На современном этапе развития цивилизации, когда осуществляется переход от индустриального к обществу знаний, где доминируют продукты интеллектуального труда, одной из важнейших составляющих является процесс информатизации, в том числе и в сфере образования. Особенность этого явления состоит в том, что доминирующим видом деятельности в сфере общественного производства является сбор, накопление, продуцирование, обработка, хранение, передача и использование информации, осуществляемые на основе современных средств вычислительной техники, а также на базе разнообразных средств информационного обмена.
К настоящему времени в науке в ряде предметных областей, в том числе в химии -накоплено большое количество знаний и информации, требующее очень большого объема работ по ее обобщению, систематизации для создания условий широкого использования этой информации учеными и специалистами. Все большую важность и значимость приобретают вопросы информационного обеспечения использования результатов фундаментальных исследований в прикладных разработках, в создании новых материалов, продуктов и технологий.
В высшем учебном заведении важнейшим звеном по переработке и предоставлению информации являются информационно-библиотечные, научные интеллект центры. Они берут на себя функции по структуризации и упорядочиванию накопленной в университете информации для наиболее быстрого предоставления информации по запросу пользователей. Активно участвуя в построении единого информационно-образовательного пространства Университета, информационный центр связывает приоритеты своей деятельности с созданием условий полного и оперативного обеспечения информацией студентов, аспирантов, профессорско-преподавательского состава, научных работников на основе прогрессивных информационно-коммуникационных технологий. Таким образом, автоматизация информационно-библиотечного центра, а значит и ускорение процессов переработки и предоставления информации позволяет существенно увеличить эффективность образовательной, инновационной и научной деятельности университета.
В диссертации разрабатываются модели и алгоритмы для реализации комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии, химической технологии и смежных отраслей знаний.
Актуальность работы подтверждается тем, что тематика диссертации связана с реализацией планов в рамках национального проекта «Образование». По этому проекту в высших учебных заведениях основной упор делается на инновационное образование, в том числе на создание электронных библиотек и обеспечение постоянного доступа пользователей к информационным ресурсам.
Цель работы. Разработка моделей и алгоритмов для реализации комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии, химической технологии и смежных отраслей знаний.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Разработать модель построения комплексной автоматизированной информационной системы и формирование структуры базы данных системы.
2. Разработать алгоритмы и программную реализацию взаимодействия реляционной БД и СУБД ISIS.
3. Разработать алгоритмы и программный комплекс взаимодействия различных модулей автоматизированной информационной системы.
4. Разработать модель постоянного удаленного доступа пользователей к ресурсам автоматизированной информационной системы.
5. Разработать алгоритм и программную реализацию дифференцированного доступа пользователей (механизм авторизации) к информационным ресурсам.
6. Разработать многоуровневый системный комплекс «Электронная библиотека»
7. Разработать модуль ввода (пополнения) информации в базы данных (БД) и электронные каталоги (ЭК)
8. Разработать эффективные модули поиска и предоставления информации то БД и ЭК, в том числе полнотекстовым, предусмотреть возможность электронной доставки документов по запросам пользователей
9. Разработать программный комплекс для создания мультимедийных электронных учебных пособий и проверочной системы оценки' знаний.
Научная новизна. Основные результаты диссертационной работы, представленные к защите и имеющие научную новизну, заключаются в следующем:
1. Разработана модель построения комплексной автоматизированной информационной системы и алгоритмы взаимодействия различных модулей системы.
2. Разработаны специальные программные модули и алгоритмы для обеспечения взаимодействия различных типов СУБД, реляционной MySQL и свободно-текстовой ISIS.
3. Разработана модель постоянного удаленного доступа пользователей к ресурсам автоматизированной информационной системы.
4. Разработана модель дифференцированного доступа пользователей (механизм авторизации) к информационным ресурсам.
Практическая значимость работы. Разработапная универсальная комплексная автоматизированная информационная система для создания, хранения и предоставления информации может быть адаптирована для условий работы вузовских информационно-библиотечных комплексов.
Разработанная комплексная автоматизированная система успешно внедрена в работу в Информационно-библиотечном центре РХТУ им. Д.И. Менделеева.
Входящие в состав комплексной автоматизированной системы модули управления, поиска по ЭК, мониторинга и ввода в БД переданы на тестирование в ГПНТБ России на предмет включения в поставку автоматизированной информационно-библиотечной системы «ИРБИС» и последующего распространения в библиотеках страны.
Созданы мультимедийные электронные учебные пособия по курсам «Методы синергетики в химии и химической технологии» и «Численные методы решения уравнений математической физики и химии», которые используются в учебном процессе РХТУ.
Апробация работы состояла в публикации материалов исследований в профессиональных периодических изданиях, в выступлении с докладами на международных конференциях и опубликовании текстов этих докладов, содержащих результаты настоящей диссертации.
Основные результаты диссертационной работы были представлены на следующих конференциях: Международная конференция молодых ученых по химии и химической технологии "MKXT-2003"; 16th Int. Congr. of Chem. and Process Engineering (CHISA-2004), Восьмая межвузовская учебно-методическая конференция «Современные тенденции подготовки химиков технологов: Международный опыт и Российские традиции»; Международная конференция ЛИБКОМ 2006 (с. Ершово, Московская область);
В 2006 г. на ВВЦ проходила III Всероссийская научно-практическая конференция «Образовательная среда сегодня и завтра», в рамках которой была организована выставка достижений высших учебных заведений. Представленная на выставке разработка
«Интернет-портал ИБЦ РХТУ», являющаяся составной частью данной диссертационной работы, удостоена медали лауреата ВВЦ.
Работы по созданию модулей электронной библиотеки, как части комплексной автоматизированной системы выполнялись по программе научно-образовательных проектов, выполняемых в РХТУ им. Д.И. Менделеева при поддержке ВР р.1.с
Публикации. По теме диссертации опубликовано 11 печатных работ.
Структура работы. Диссертационная работа состоит из введения, обзора литературы, экспериментальной части, практической реализации, выводов и списка цитируемой литературы (80 ссылок), и включает 48 рисунков, 11 схем и 10 таблиц. Общий объем диссертации составляет 130 страниц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы диссертационной работы, формулируются основные положения и цель, а также задачи исследования. Определяется научная новизна, практическая значимость, приводятся основные результаты работы.
Первая глава «Литературный обзор» посвящена обзору современных автоматизированных информационных и информационно-библиотечных систем для хранения и предоставления информации, средствам поиска по электронным каталогам; базам данных, как библиографическим, так и полнотекстовым по химии, химической технологии и смежным отраслям знаний; электронным библиотекам. Исследуется состояние и результаты использования различных автоматизированных информационных систем. На основании проведенного обзора делается вывод о том, что в настоящее время, к сожалению, не существует единой информационной системы для вузов, которая бы удовлетворяла всем необходимым требованиям в комплексе, а именно:
- связь воедино различных информационных и библиотечных сервисов (электронные каталоги, базы данных, электронные библиотеки, справочные ресурсы и др.)
- обеспечение постоянного (24 часа в день, 365 дней в году) удаленного доступа пользователей к ресурсам информационной системы, удаленное обслуживание пользователей
- дифференциация доступа различных категорий пользователей (студенты, аспиранты, преподаватели) к различным ресурсам информационной системы
- удаленное пополнение баз данных и других ресурсов информационной системы
В соответствии с целью работы и на основании выводов, сделанных в результате анализа литературы, сформулирована постановка задач исследования, а именно, создание
комплексной автоматизированной информационной системы для создания, хранения и предоставления информации в области химии и химической технологии.
Вторая глава диссертации посвящена методике создания комплексной автоматизированной информационной системы, а также разработке алгоритмов обработки, поиска и предоставления информации.
Алгоритм методики имеет следующие этапы:
• Проведение анализа существующих типов информации в области химии и химической технологии, используемых в образовательной и научной среде. Выделение основных групп информации. Выбор способа хранения данных.
• Разработка функциональной структуры системы, определение основных модулей, из которых состоит система.
• Проектирование структуры баз данных, составляющих систему. Определение перекрестных связей.
• Разработка методов и алгоритмов модулей системы
Информация, используемая в процессе обучения и научной деятельности в вузах химико-технологического профиля, крайне разнородна. Эта информация включает в себя следующее основные данные: лекции, семинарские занятия, методические пособия, результаты лабораторных исследований, статьи в журналах, библиографические базы данных, сборники трудов научных конференций, патенты и многое другое. Такая информация сложно поддается классификации и типизации. Очевидно, что хранение накопленных данных и знаний в данной области и наличие инструментов их обработки является насущной необходимостью. Однако, задача создания таких инструментов чрезвычайно сложна именно из-за крайней неопределенности, нетипизированности накопленной информации и отсутствии общепринятых подходов к решению подобных проблем.
Функциональным назначением комплексной автоматизированной информационной системы являются: сбор, хранение, анализ, обработка и предоставление информации различным категориям пользователей в образовательной и научной деятельности.
Справедливо представление о комплексной информационной системе как многомодульной, имеющей иерархическую структуру. Система должна иметь возможность самоадаптации к изменяющейся внешней среде, а программное обеспечение и электронные компоненты должны соответствовать принципу обратной совместимости. Такое построение комплексной информационной системы дает следующие преимущества: гибкость, модульность, параллельность, охват, экономичность, технологичность.
Созданная информационная система включает распределенные базы данных, а также системы управления базами данных. Базы данных системы предназначены для сбора и хранения информации. Системы управления базами данных предназначены для управления базами данных, обеспечения их целостности и защиту от несанкционированного доступа. При формировании модели структуры БД системы пришлось разработать специальные программные модули для обмена данными между различными типами БД — табличными реляционными (MySQL) и свободно-текстовой БД CDS/ISIS, рекомендованной ЮНЕСКО для хранения библиографической информации. В MySQL хранится служебная и вспомогательная информация, такая например как: структура полей БД для заполнения пользователями, статистика поисковых запросов, права доступа пользователей к различным модулям системы, информация о должниках, корзина заказов, текущее состояние обработки заказанных документов и др. Между таблицами БД существуют различные перекрестные связи.
Основным преимуществом СУБД MySQL является упорядоченность информации и простые механизмы извлечения и записи данных. CDS ISIS же представляется удобной СУБД для хранения неструктурированной информации, но, к сожалению, в настоящее время не существует простой технологии, позволяющей быстро извлекать и записывать данные из БД ISIS. Поэтому в работе была создана уникальная структура БД реляционной СУБД MySQL, используя которые мы можем уйти от необходимости каждый раз структурировать информацию, т.е. приводить ее к табличному виду.
В работе последовательно построена каноническая модель БД. Каноническая структура реляционной БД подразумевает безызбыточность информации, т.е. в таблицах хранится лишь такая информация, которая не может быть получена никакими функциями над уже имеющимися данными.
На основе анализа общих закономерностей построения информационных систем в диссертации сформирована обобщенная модель структуры реляционной БД.
Пусть О есть некоторое множество попарно непересекающихся объектов, р соотношение подчиненности на О и X" р2—» - функция, которая каждой паре объектов (02,01) в р ставит в соответствие число x(oi,oi)e , называемое характеристикой подчиненности ог объекту о\, так, что если 02P01 и для некоторой таблицы в ог, внешний ключ К12 которой ссылается на первичный ключ К\ объекта О], имеет место АГ12П К^О, то x(o2,oi)*2. Тогда тройка (0,р,х) называется базой данных, если выполнены следующие два условия:
• условие определенности первичного ключа - для первичного ключа К любой информационной таблицы (t£) е ЩО) справедливо Л &
• условие ссылочной целостности объектов - для любых двух таблиц из разных объектов в О если внешний ключ одной из них ■ ссылается на первичный ключ другой, то эта другая таблица должна быть непременно родительской в своем объекте, т.е. в неродительские таблицы одних объектов нет ссылок из таблиц других объектов.
Вместе с условием ссылочной целостности таблиц эти условия есть условия целостности базы данных.
Введем следующие четыре операции действий над БД: Select - чтение, Insert -запись, Delete - стирание и Update - обновление. Каждая из них является функцией от пяти аргументов и записывается в форме Nam(K,ii,P,o,a), где Nam - имя операции, Name , P=(0,p,x) - база данных, и - субъект базы 13, у - ее состояние доступа, о - объект в 13 и а - способ адресации данных. Операция действует лишь на данные в базе, изменяя значения таблиц в О и сохраняя параметры р, Х-Результатом операции является база данных, однотипная с J3.
Первые две операции - Select и Insert - выполняются как select и insert независимо от отношения р и его характеристики х в базе В, а именно:
Selects,у,P,oJ>MO',p,x.), где 0*=. Операции же Update и Delete выражаются через update и delete в зависимости от параметров р и х базы В следующим образом.
• заменяется на delete(w,u,o,a) (соответственно на update(ti,y,o,a));
• для любых oi, е>2 в о" (соответственно в О1) таких, что 02Р01, в таблице (¡2+>) в 02, внешний ключ Кц которой ссылается на первичный ключ К родительской таблицы (t,s) в о\, при x(°2,oi)=l из S удаляется всякое s\ для которого а ПРИ X(02,0i)=2 каждое такое ■s'JX^] заменяется символом Л.
Операции Select, Insert, Delete, Update называются операциями манипулирования с базами данных, а три последние, т.е. Insert, Delete, Update - операциями модификации баз данных.
Рассматривая задачу реализации хранения произвольной неструктурированной информации в реляционной базе данных, можно видеть, что она распадается на две части - задачу реализации сущностей, и задачу представления структур сущностей. Атрибуты сущностей рассматриваются как столбцы соответствующих таблиц. Структура данных для объектов, представляющих сущности, может быть следующая:
• Сами объекты представляются уникальным идентификатором (ID), перечень которых хранится в соответствующей таблице. Ю не имеет никакого содержательного смысла, а имеет лишь одно свойство — он никогда не изменяется, только появляется и исчезает. ID олицетворяет объект в самом абстрактном виде, без каких-либо его свойств.
• Произвольное количество различных свойств (атрибутов) объектов хранится в других таблицах, по одной на каждый обрабатываемый тип свойства. Практически в библиотечпо-библиографических системах достаточно только одной таблицы, содержащей атрибуты текстового типа. Атрибутам может приписываться различный содержательный смысл (пользовательская семантика) из расширяемого списка семантик.
Отношение «Сущности» состоит из одного атрибута - ID сущности - автонумеруемое целое. Отношение «Свойства сущностей» имеет атрибуты ID сущности, ID свойства — автонумеруемое целое, Название сущности. Связь между «основными» и «подчинёнными» структурами описывается Отношением «Метаструктура» Ш_структуры-родителя, ГО_структуры-потомка.
Между таблицами БД существуют различные перекрестные связи. В общем виде структуру таблиц можно представить следующей схемой (рис.1) - таблица категорий, таблица сущностей, таблица записей и таблица значения сущностей. Как мы видим, такая структура позволяет уйти от ограничения накладываемыми табличностью БД и формировать БД с неограниченным набором полей (сущностей).
По данной схеме реализована структура таблиц БД следующих модулей комплексной информационной системы: электронная библиотека, авторизация пользователей, заказ литературы и обработка заказов.
В CDS/ISIS хранятся непосредственно сами записи каталогов и БД. Пространство ISIS обращается к множеству ресурсов ISIS, которые соответствуют стандарту базы данных ISIS: один файл с основными данными, одип инвертированный файл, файлы
точности данных, технические требования одного формата, одна таблица полей выбора, и т.д. Приложение ISIS может открывать несколько пространств ISIS.
П> категории (автонуыеруемо е целое) Назвашге категории ID родительской категории
ГО сущности Название
(автонумеруемо е сущности
Таблица записей Таблица явлений сущностей)
Ш категории XD хашкя m запит ГО Зкгсшие
(автонунеруемое (автонуыеруемое сущности сущности
Рис. 1. Структура таблиц реляционной БД В третьей главе рассматривается модель построения комплексной автоматизированной информационной системы. Реализация предоставления информации конечному пользователю в системе выбрана на основе интернет-технологий.
Разработанные модули, из которых состоит автоматизированная система:
1. Модуль ввода информации в электронный каталог и базы данных Включает в себя автоматизированной рабочее место (АРМ) «Каталогизатор» АБИС «ИРБИС» а также возможность удаленного ввода записей в каталоги и баз данных с помощью разработанного модуля через веб-интерфейс;
2. Модуль поиска информации по базам данных, в т.ч. полнотекстовым и электронному каталогу;
3. Модуль заказа документов;
4. Модуль «Электронная библиотека»;
5. Модуль электронной доставки документов;
6. Модуль дифференцированного доступа к системе и персонификации доступа;
7. Модуль управления;
8. Модуль «Интернет-портал»;
9. Модуль для создания мультимедийных электронных учебных пособий и проверочной системы оценки знаний.
10, Модуль сбора и учета статистики. Разработанная модульная структура комплексной автоматизированной информационной сасгемы допускает подключение внешних программных проектов в качестве дошшитегшцых компонентов. С'фуетурная схема системы приведена парке, 2.
[КОМПЛЕКСНАЯ АВТОМАТИЗИРОВАННАЯ ИНФ ОРМАЩИОННАЯ Щ СИСТЕМА I
Рис. 2. Структурная схема комтексиой автоматизированной информационной системы
Разработаны программные модули, в структуре модулей электродной библиотеки, организации службы электронной доставки документов и автоматизация обработки заказов на получение электронных копий документов.
Пщпготмсгсшм БД u nt>aj ьгк. мтднчеехке i> h лэс яя
ЯС КШ, DüiHVftWiil тесисдогяя И - г V: * U дне ЦШ1 аы. ^епошнаслии л РХГУ»
Пм к oreкстовЫt базы д»кинЛс Мкермиш »он^еренцнА, irp-ав-гдкмьа «а бтоеРХТУ iu* ДЕ-
MWflrViitl* «Ven»BI з Iwon
ютфвриеца ff хЖКЧМХйв
БД * Авторефераты н диссертации, защищенные в днгеертацжонЕых сое mat РХГУ»
ЕД^Сернодщчеоик иэдмкл» с
Л-С'СТ*1вЙЯОЙ pOtÖKtWÖ «►держдями «е«гр-;-аЕой *5П«Й Kftilipьсь сгя-в)
Эдесфовны* аиаг.огя пе"итгьа юд±мнй. кикги в киадичеайг пастил
Мультимедиен we «лектродлие учеБнке пособм по орсеедтвкшая РХТУДНЕЦШИЛЙЫ**
Методы iHittprcnnnr в гаки* к хккячесисй технолог-"Я
Бв5длЕтр»ф^ч(асне бзэьз дапш*
Рис J. Основные компоненты электронной библиотеки
Программная реализация всех модулей выполнена на языке программирования PUP. Также на PHP разрабо тан ряд функций дня чтения, добавления и изменения записей в CDS/ISIS используя библиотеку Lsis32.dll. В диссертации описаны программные модули, входящие в состав системы.
В четвертой главе описывается практическая реализация комплексной автоматизированной информационной системы в Информационно-библиотечном центре ГШЩ) РХТУ- Доступ пользователей к ресурсам системы обеспечен через Интернет-портал (рис.4).
Внедрение разработанной комплексной автоматизированной информационно^ системы в совокупности с использованием информационно-библиотечной системы «ИРБИС», а также использование штрих-кодовых технологий, обеспечило компьютеризацию всех направлении деятельности ИБЦ и позволило осуществить на базе имеющегося Програлгмно-тещшческого комплекса различные процессы информационно-библиотечной работы, Это
заказ новых документов и контроль полноты их выполнения, регистрация поступлений в отделе комплектования;