Способ сокращения объема памяти, требуемого базой данных для хранения данных, и создания базы данных

Номер патента: 1826

Опубликовано: 27.08.2001

Автор: Эль-Газзар Амин

Скачать PDF файл.

Формула / Реферат

1. Способ сокращения объема памяти, требуемого базой данных для хранения информации, отличающийся тем, что

- сохраняемые единицы информации распределяют по точкам пересечения строк и столбцов, по меньшей мере, двумерной растровой матрицы,

- размещенным в растровой матрице единицам информации присваивают индивидуальные координаты цвета и

- сформированную таким путем матрицу изображения сохраняют в качестве базы данных или части базы данных.

2. Способ по п.1, отличающийся тем, что в качестве координат цвета используют совокупность координат основных RGB-цветов.

3. Способ по п.1 или 2, отличающийся тем, что координаты цвета матрицы изображения перед ее сохранением в качестве базы данных или части базы данных подвергают процессу сжатия изображения.

4. Способ по любому из пп.1-3, отличающийся тем, что значениям по осям растровой матрицы ставят в соответствие устанавливаемое с помощью алгоритмов или таблицы перекрестных ссылок информационное содержание.

5. Устройство для осуществления способа по п.1 или 2, отличающееся наличием

- блока преобразования цветовых координат (БПЦ), который с помощью алгоритма или таблицы перекрестных ссылок распределяет единицы атомарной, молекулярной или метаинформации по точкам пересечения столбцов и строк цветовой матрицы в виде соответствующей цветовой координаты в пределах определяемого этой матрицей цветового пространства,

- банка памяти (куба данных) для хранения координат цвета и

- интерфейса (машины баз данных), задающего или считывающего координаты цвета, полученные с помощью блока преобразования координат цвета.

6. Устройство по п.5, отличающееся наличием распределителя значений по осям (БПО), который с помощью алгоритма или таблицы перекрестных ссылок распределяет единицы атомарной, молекулярной или метаинформации по заданным значениям по осям системы координат, которая соответствует многомерной матрице координат цвета.

7. Устройство по п.5 или 6, отличающееся наличием функционально связанного с банком памяти устройства для сжатия матрицы координат цвета без потери информации.

Текст

Смотреть все

1 Настоящее изобретение относится к способу сокращения объема памяти, требуемого базой данных для хранения данных, а также к устройству для осуществления этого способа. Умелое моделирование базы данных является проблемой, прежде всего, при поступлении очень больших объемов информации. В качестве наглядного примера, поясняющего необходимость решения этой проблемы, можно назвать телефонную связь, где существует стремление или необходимость хранить в памяти информацию по тарифам на услуги связи или другие индивидуально присваиваемые единицы информации для любых комбинаций населенных пунктов по всему миру, соответственно, по меньшей мере, по относительно крупной стране,такой, например, как Германия. Выделяемая для хранения такой информации память должна иметь минимально возможный объем. Однако в одной только Германии уже имеется в целом 5604 х 5604 возможных комбинаций телефонных кодов населенных пунктов, что в целом соответствует более чем 30 миллионам записей данных. При этом каждая запись состоит из, по меньшей мере, двух выраженных длинным целым числом значений по 4 байта только для обозначения телефонного кода населенного пункта, из обозначения названий населенных пунктов длиной до 25 байт и из информации,идентифицирующей отдельные тарифные зоны,длиной, по меньшей мере, 4 байта. Таким образом, длина каждой записи составляет, по меньшей мере, 4+4+25+4=37 байт. В результате объем всей базы данных должен был бы составлять около 1,1 Гбайта, и это еще без учета так называемых непроизводительных затрат (индексации и т.д.) соответствующей базы данных. Путем умелого моделирования баз данных и классических методов сжатия данных можно было бы сократить необходимый объем памяти примерно до 100 Мбайт. Поэтому существует стремление в еще большей степени сократить требуемую для хранения данных емкость памяти для определенных систем баз данных, более подробно описанных ниже. Из DE 3425844 А 1 известен способ быстрого нахождения в памяти данных определенных записей, создаваемых телефонными коммутаторами сети дальней связи (междугородной телефонной станцией) или системами обработки данных (соответственно большими ЭВМ). В этом способе при вводе записей в память данных предусмотрено одновременное параллельное сохранение в особой области памяти поисковых признаков в виде так называемых ключевых слов. При дальнейшей обработке или при распечатке записей каждый раз при отыскании совпадающего с поисковым признаком ключевого слова показание счетчика адреса, осуществляющего последовательный поиск в особой области памяти, используется для адресации 2 соответствующей записи, отыскиваемой в памяти данных. Другой способ поиска информации в памяти данных известен из DE 3908684 А 1. Согласно этому способу в n-мерной системе координат задают конечную область управления данными, расположенную внутри этой области управления область поиска, а также объекты поиска, при этом определяют те объекты поиска, которые пересекают область поиска. Указанные способы также позволяют лишь незначительно уменьшить требуемый для хранения данных объем памяти. Исходя из вышеизложенного, в основу настоящего изобретения была положена задача разработать способ и устройство для осуществления этого способа, которые позволили бы уменьшить требуемый для определенных баз данных объем памяти в еще большей степени,чем это было известно до сих пор. Предлагаемый в изобретении способ сокращения объема памяти, требуемого базой данных для хранения информации, отличается тем, что сохраняемые единицы информации распределяют по точкам пересечения строк и столбцов, по меньшей мере, двумерной растровой матрицы, размещенным в растровой матрице единицам информации присваивают индивидуальные координаты цвета и сформированную таким путем матрицу изображения сохраняют в качестве базы данных или части базы данных,предпочтительно предварительно подвергнув матрицу изображения сжатию изображения. Растровую матрицу образуют оси, а устанавливаемому либо с помощью алгоритмов,либо с помощью таблиц перекрестных ссылок информационному содержанию ставятся в соответствие отдельные значения по осям. В качестве координат цвета в растровой матрице изображения могут быть использованы, в частности, известные и заданные координаты основных RGB-цветов, что позволяет применять для дальнейшего значительного сокращения потребности в памяти классические, не приводящие к потере данных методы их сжатия. Предлагаемое в изобретении устройство для осуществления способа согласно изобретению отличается наличием указанных в п.5 формулы изобретения признаков, а его предпочтительные варианты выполнения представлены в соответствующих зависимых пунктах формулы. Ниже изобретение более подробно поясняется на примере одного из вариантов его осуществления со ссылкой на прилагаемый чертеж. Основная идея изобретения заключается в том, что любую информацию можно интерпретировать в виде цветовых координат в многомерном, например, двумерном, цветовом пространстве, определяющем определенное изображение. При этом сложные по своей структуре информационные группы, например, базы данных или большие по объему таблицы, пред 3 ставляют в виде последовательности цветовых координат, т.е. в виде изображений. Эти цветовые координаты располагают не в произвольном порядке, а в виде многомерной матрицы, соответственно системы координат, при этом по осям координат распределяют собственное информационное содержание. Не говоря уже о сокращении потребности в памяти, благодаря указанному преобразованию цветовых координат, такое техническое решение позволяет использовать в отношении полученных в результате преобразования изображений классические,не приводящие к потере информации методы сжатия изображения. В классических базах данных информация обычно хранится в виде таблиц, при этом каждый столбец имеет свое собственное информационное содержание, а строки этих таблиц используются (если они вообще используются) в целях идентификации. Настоящее изобретение предусматривает формирование и интерпретацию сочетаний атомарных или молекулярных единиц информации,прежде всего в виде совокупности цветовых координат. Так, например, сочетание трех символов ASCII-кода образует одну цветовую координату. При этом соответствие цветовых координат определенным наборам символов определяется либо алгоритмом, либо таблицей перекрестных ссылок, или таблицей распределения,которые в свою очередь также можно запоминать как информацию в виде изображения. В отношении вышеописанного примера с базой данных, содержащей информацию о тарифах на услуги телефонной связи, по оси х двумерной цветовой матрицы можно распределить, например, населенные пункты-адресаты входящих телефонных вызовов, а по оси у - населенные пункты-источники исходящих телефонных вызовов. Таким образом, образуется матрица размером 5604 х 5604. В точках пересечения ее строк и столбцов при этом записывается информация о соответствующей тарифной зоне. Дополнительно необходимо использование индекса, которым строке, соответственно столбцу, этой матрицы присваивается соответствующий телефонный код. Соответствующая информация о тарифах вводится в матрицу в виде цветовой координаты. В результате получают битовый массив, или поразрядную карту отображения(bitmap),общим размером 5604 х 5604 и насыщенностью (глубиной) цвета 4 байта соответственно. Объем памяти, необходимый для хранения такого битового массива,составляет при этом около 13 Мбайт. Однако поскольку теперь речь идет о графической информации, становится возможным без какихлибо проблем использовать классические методы сжатия этой графической информации без ее потери. Если взять за основу, например, форматPNG, то для получаемой в результате базы данных в конечном итоге необходимый объем па 001826 4 мяти должен составлять всего лишь около 650 кбайт при одновременно более быстром доступе к отдельным записям. На прилагаемом чертеже схематично показаны отдельные элементы базы данных или ее структура при использовании предлагаемого в изобретении способа. В случае, если за основу взята система с распределением информации по нескольким осям координат, в базе данных предусмотрен распределитель значений по осям или блок преобразования значений по осям (БПО; англ. обозначение ATU от Axis Translation Unit). Указанный БПО с использованием определенного алгоритма или таблицы перекрестных ссылок присваивает атомарной, молекулярной или метаинформации определенное значение по осям,а также снова преобразует это значение в обратном направлении. Наглядным примером такой метаинформации может служить, например,указатель на документе или в более сложных случаях "реальное" изображение. Известно, что изображения представляют собой (как правило) двумерные структуры("распределения"), построенные на основании отдельных цветовых координат. Таким образом,изображение можно рассматривать и как систему координат, причем в данном контексте речь идет о дву- или многомерных системах координат, в которых необходимо определить местоположение отдельных цветовых координат. В случае использования систем координат,имеющих более двух измерений, можно говорить также о цветовых пространствах. Если в качестве примера рассмотреть двумерную систему координат, то в отношении приведенного выше примера легко сформулировать правило распределения, лежащее в основе работы БПО:"Взять целое значение телефонного кода в качестве значения по осям", где информационным пространством является в этом случае множество всех населенных пунктовисточников телефонных вызовов. Сам БПО, в свою очередь, обращается к блоку преобразования цветовых координат(БПЦ; англ. обозначение CTU от Colour Translation Unit), который некоторой информации ставит в соответствие определенные значения по осям, т.е. отдельные цветовые координаты ставит в соответствие определенным единицам атомарной, молекулярной или метаинформации,и наоборот. Такое распределение и в этом случае может осуществляться с помощью соответствующих алгоритмов или же с помощью таблиц перекрестных ссылок. При этом используется следующий основной принцип. Цветовые координаты можно, как известно, описать значениями основных цветов системы RGB (RGB-значениями). При этом в RGBзначении доля красного, зеленого и синего цве 5 тов в каждом случае характеризуется соответствующим значением, например, длиной 8 байт (в десятичном исчислении: от 0 до 255). Эти три отдельные цветовые координаты пересчитывают в одно единое RGB-значение, например: красный = 255, зеленый = 255, синий = 255RGB = 16777215 или красный = 65, зеленый = 43, синий = 0RGB = 11073. В этом случае сочетание трех отдельных значений получают путем побитового сведения отдельных цветовых координат в одно цветовое значение длиной 24 байта, что можно пояснить на следующем примере. Пример. 255 соответствует 11111111. Тем самым RGB-значение (255, 255, 255) в двоичном представлении выглядит как 11111111 11111111 11111111. Таким образом, этот пример наглядно показывает, что определенная информация может быть "преобразована" в цветовые координаты, а именно- либо с помощью заданной таблицы перекрестных ссылок по отдельным двоичным значениям,- либо с помощью таблицы перекрестных ссылок, ставящей RGB-значения в соответствие атомарной, молекулярной или метаинформации,- либо с помощью определенного алгоритма или таблицы перекрестных ссылок, ставящей атомарную, молекулярную или метаинформацию в соответствие соответствующим значениям красного, зеленого и синего цветов. Иными словами, БПЦ присваивает атомарной, молекулярной или метаинформации определенную цветовую координату, т.е. значение аддитивной смеси основных цветов, например, RGB-значение. При этом способ не ограничен только формированием, например, 24 байтовых RGB-значений и может аналогичным образом использоваться в отношении любых других координат цвета, например, для формирования 32-байтовых RGB-значений. Сказанное поясняется ниже на простом примере для логики БПЦ:"Составить цветовую координату в каждом случае из трех последовательных значенийASCII-кода". Следуя этому простому правилу, можно было бы представить, например, немецкое слово"Beispieltext" ("Пример текста") в виде последовательности координат цвета, составленной из четырех пикселей (элементов изображения):(101,108,116)(101,120,116)6907202,6910067,7629925,7632997. Использование распределителя значений по осям (БПО) в сочетании с блоком преобразования цветовых координат (БПЦ) позволяет простым образом использовать также определенные, не применимые в классических систе 001826 6 мах баз данных оси координат для запоминания дополнительной информации. В этом случае данные или информация фактически хранятся в изображениях или цветовых пространствах в банке памяти, названном на чертеже кубом данных. Как уже говорилось выше, использование двумерного цветового пространства (изображения) позволяет применять для дальнейшего сжатия данных и сокращения требуемой емкости памяти классические методы сжатия данных без их потерь. В случае использования цветовых пространств, имеющих более двух измерений,либо эти пространства можно моделировать с помощью двумерных изображений, либо существует возможность адаптировать соответствующие алгоритмы, обеспечивающие сжатие данных без их потерь, к многомерным цветовым пространствам. И, наконец, для связи с внешним миром предусмотрен названный машиной баз данных интерфейс, основной задачей которого является(промежуточное) хранение и поиск информации. Кроме того, этот интерфейс должен выполнять все основные функции классических систем баз данных, и, таким образом, он отличается только по форме своей фактической реализации. Если не рассматривать дополнительные функции этого интерфейса, а выделить только основные, то собственно его отличие состоит в том, что в многомерных цветовых пространствах считывание, соответственно задание необходимых согласно изобретению значений пикселей должно выполняться через этот интерфейс базы данных. Основной процесс обработки данных выглядит при этом, как правило, следующим образом:(1) БПЦ преобразует поступающие единицы информации в координаты цвета,(2) БПО (при необходимости несколько блоков), в свою очередь, располагает единицы информации (координаты цвета) в их соответствующих информационных пространствах и(3) машина баз данных задает или считывает в соответствующем месте цветовые координаты, полученные блоком БПЦ в памяти данных (кубе данных). Особые преимущества предлагаемого в изобретении решения касательно организации базы данных состоят, прежде всего, в следующем:- необходимый объем памяти значительно сокращается, например, в 100 раз, т.е., например, с 100 Мбайт до 650 кбайт;- убыстряется доступ к базе данных благодаря предлагаемой архитектуре и меньшим размерам базы данных. Первоначальное сокращение требуемого объема памяти достигается уже за счет использования блока преобразования цветовых координат (БПЦ), а следующее существенное со 7 кращение обеспечивается за счет дополнительного использования распределителя значений по осям (БПО). Предлагаемый в изобретении способ, соответственно описанная структура базы данных с меньшей потребностью в объеме памяти могут быть использованы прежде всего в тех случаях,где имеет место поступление очень больших объемов информации, или в случаях, когда затраты на передачу информации зависят от ее объема, например, в системах с предоставлением услуг "видео-по-требованию" или "новостипо-требованию", а также для передачи информации по сети Интернет и т.п. Для этих областей применения оправдывают себя дополнительные затраты на моделирование базы данных, необходимые по сравнению с классическими системами баз данных. В настоящее время наибольший интерес проявляется к применению систем баз данных для глобальной маршрутизации, прежде всего для услуг по передаче факсов по сети Интернет, а также к упоминавшемуся уже использованию систем для хранения информации по тарифам и для расчетов через автоматы по продаже проездных билетов. ФОРМУЛА ИЗОБРЕТЕНИЯ 1. Способ сокращения объема памяти, требуемого базой данных для хранения информации, отличающийся тем, что- сохраняемые единицы информации распределяют по точкам пересечения строк и столбцов, по меньшей мере, двумерной растровой матрицы,- размещенным в растровой матрице единицам информации присваивают индивидуальные координаты цвета и- сформированную таким путем матрицу изображения сохраняют в качестве базы данных или части базы данных. 2. Способ по п.1, отличающийся тем, что в качестве координат цвета используют совокупность координат основных RGB-цветов. 3. Способ по п.1 или 2, отличающийся тем,что координаты цвета матрицы изображения перед ее сохранением в качестве базы данных или части базы данных подвергают процессу сжатия изображения. 4. Способ по любому из пп.1-3, отличающийся тем, что значениям по осям растровой 8 матрицы ставят в соответствие устанавливаемое с помощью алгоритмов или таблицы перекрестных ссылок информационное содержание. 5. Устройство для осуществления способа по п.1 или 2, отличающееся наличием- блока преобразования цветовых координат (БПЦ), который с помощью алгоритма или таблицы перекрестных ссылок распределяет единицы атомарной, молекулярной или метаинформации по точкам пересечения столбцов и строк цветовой матрицы в виде соответствующей цветовой координаты в пределах определяемого этой матрицей цветового пространства,- банка памяти (куба данных) для хранения координат цвета и- интерфейса (машины баз данных), задающего или считывающего координаты цвета,полученные с помощью блока преобразования координат цвета. 6. Устройство по п.5, отличающееся наличием распределителя значений по осям (БПО),который с помощью алгоритма или таблицы перекрестных ссылок распределяет единицы атомарной, молекулярной или метаинформации по заданным значениям по осям системы координат, которая соответствует многомерной матрице координат цвета. 7. Устройство по п.5 или 6, отличающееся наличием функционально связанного с банком памяти устройства для сжатия матрицы координат цвета без потери информации.

МПК / Метки

МПК: G06F 17/30

Метки: хранения, базой, данных, базы, сокращения, способ, объема, создания, требуемого, памяти

Код ссылки

<a href="http://easpatents.com/5-1826-sposob-sokrashheniya-obema-pamyati-trebuemogo-bazojj-dannyh-dlya-hraneniya-dannyh-i-sozdaniya-bazy-dannyh.html" rel="bookmark" title="База патентов Евразийского Союза">Способ сокращения объема памяти, требуемого базой данных для хранения данных, и создания базы данных</a>

Похожие патенты