Rambler's Top100

(c)2009-2017 openinfotech.ru

СУБД HyTech

Пресса о СУБД


РАСШИРЕНИЕ ВОЗМОЖНОСТЕЙ СУБД HYTECH НА ПРИМЕРЕ ИНТЕГРАЦИИ ПОЛНОТЕКСТОВОГО ПОИСКА

В работе рассматривается способ расширения возможностей обработки данных в СУБД HyTech на примере интеграции механизмов полнотекстового поиска с помощью API (application programming interface, интерфейс прикладного программирования) указанной СУБД.

В современном мире одним из наиболее ценных ресурсов является информация. Но информацией мало обладать, ее нужно уметь обрабатывать, поэтому высоко ценятся эффективные средства хранения, манипулирования и управления доступом к данным, коими несомненно являются системы управления базами данных (СУБД). Помимо всем известных СУБД (таких как, например, Oracle или PostgreSQL), в данной области есть и отечественные разработки, среди которых можно выделить СУБД HyTech.

СУБД HyTech является полностью самостоятельной и патентно чистой разработкой (патент РФ на изобретение получен в 1991 году) и предназначена для создания, ведения и использования реляционных баз данных больших и сверхбольших объемов [1]. СУБД HyTech реализована для архитектуры клиент-сервер, способна работать под управлением разных операционных систем (ОС семейств Windows и Linux), распространяется бесплатно. Кроме того, HyTech обладает некоторыми специфическими возможностями, которые не реализованы или находятся в «зачаточном» состоянии в других СУБД, занимающих аналогичную нишу на рынке данных программных продуктов. Одна из таких возможностей – открытый и документированный API (application programming interface, интерфейс прикладного программирования). Именно благодаря этому механизму становится возможным создание различных дополнений к данной СУБД, позволяющих существенно расширить возможности обработки данных. В данной работе в качестве примера рассматривается интеграция в СУБД HyTech механизма полнотекстового поиска.

Поскольку на данный момент существует достаточное количество открытых механизмов полнотекстового поиска, разработка собственного продукта, выполняющего схожие функции, экономически нецелесообразна. В связи с этим в качестве машины полнотекстового поиска был выбран свободно распространяемый программный продукт Sphinx [2]. Выбор данного продукта связан с тем, что он имеет высокие скорости индексации и поиска, а также поддерживает морфологический разбор слов (стемминг) русского языка.

API СУБД HyTech используется в двух случаях:

  • при построении индексов полнотекстового поиска для передачи содержимого текстовых полей таблиц базы данных утилите индексации;
  • собственно при полнотекстовом поиске для сохранения результатов поиска, выданных машиной Sphinx, во временную таблицу в базе данных.

Таким образом, возможности обычного встроенного в СУБД поиска по текстовым полям с использованием SQL-операторов like и likecase существенно расширяются за счет использования полнотекстового поиска по индексам, построенным с учетом морфологического анализа слов.

Естественно, что расширение возможностей не ограничивается лишь поиском. С помощью дополнений можно и изменять данные – например, при необходимости, можно создать дополнение, которое будет выполнять дискретное преобразование Фурье над прочитанным из базы данных (БД) массивом данных и записывать результат обратно в БД.

Основываясь на вышеизложенном, можно сделать вывод о том, что СУБД HyTech является универсальным средством для решения различных задач, в которых требуется специфическая работа с данными, поскольку с использованием API можно обрабатывать данные нетривиальными способами в самой СУБД, не вынося обработку в клиентское приложение. Благодаря этому данные будут обрабатываться там же, где и хранятся, что позволит увеличить скорость обработки и повысить защищенность обрабатываемых сведений.

Список литературы
1. СУБД HyTech [Электронный ресурс] – электронные текстовые данные. Режим доступа: [http://www.hytechdb.ru], свободный.
2. Машина полнотекстового поиска Sphinx [Электронный ресурс] – электронные текстовые данные. Режим доступа: [http://www.sphinxsearch.com], свободный.

А.М. ПРУДНИКОВ. Научный руководитель – М.В. МАРКОВСКИЙ, к.т.н., доцент, Национальный исследовательский ядерный университет «МИФИ». Библиографическая ссылка: Научная сессия МИФИ-2010. XIII конференция «Молодежь и наука»: Тезисы докладов. В 3-х частях. М.: НИЯУ МИФИ, 2010. Ч. 2. С. 161 – 162.