Речь здесь пойдет о нахождении технических решений, относящихся к интеллектуальному анализу данных – к его инструментарию, к структуре и функциям этого инструментария и его организации. Также рассматриваются пути разработки программных систем, могущих повысить эффективность большого количества данных для таких целей, как интеллектуальный анализ, к которому относятся прогнозирование, обучение, классификация.
Автоматизированные информационные системы, или АИС, за последние годы показали стремительное развитие, в частности особенно это видно в такой области как инструменты и языки программирования, представление и хранение информации и сведений, так называемые «облачные вычисления», искусственный интеллект и другие сферы.
В результате повышения скорости развития такой сферы как сфера искусственного интеллекта, или ИИ, начали стремительно развиваться информационные системы – образуются новые их классы и трансформируются старые, показывая новые стандарты и результаты. Специалисты отмечают этот прогресс, но замечают при этом, что во многих случаях информационные системы все еще сохраняют разрозненность, либо настроены в каких-то комплексах все под один и тот же класс, либо решают только предметные и частные задачи.
При этом информационные системы развиваются в числе классов, превращаясь в системы принятия решений, экспертные системы, системы интеллектуального анализаданных, интеллектуальные информационные системы и другие типы систем. Недостаток функциональности в некоторых случаях, там, где он наблюдается, происходит от того, что человек сперва стремится больше к концептуальному наименованию новых продуктов, к наименованию открытий, им интеллектуально понятых, к учебе и закреплению понятийных знаний, нежели к тому, чтобы производить новую информацию и технику. Эта тенденция также стоит на пути у развития информационных систем и стоит как препятствия на других направлениях, там, где в работе участвуют действительно прогрессивные, по своей мотивации, мыслительные силы и кадры.
Несмотря на указанные возможные и для кого-то явные недостатки новых классов вычислительных систем и ресурсов, их нынешний уровень автоматизации позволяет задуматься о том, что на их основе можно было бы создать некие надсистемы. Которые могли бы объединять в себе и под собой все те инструментарии, методологии, технологии и алгоритмы, которые сейчас используются в разных, по классу и сущности работы, вычислительных системах, окружающих тему интеллектуальной обработки информации.
Перспектива создания таких надсистем видится в создании из них автоматизированных механизмов интеллектуальной поддержки при принятии управленческих решений, а также в создании интеллектуальных хранилищ информации (знаний) и связанных с ними автоматизированных систем обработки информации и получения знаний (datamining). В конечном счете это связано с развитием алгоритмов и технологий интеллектуальной обработки данных.
Откуда появляются интернет-технологии и СИОД
СИОД, системы интеллектуальной обработки данных, и интернет-технологии берут свое начало в понимании того, что просто накопленную информацию можно как-то эффективно использовать. С развитием компьютеризации огромное количество данных начало стремительно накапливаться в электронном виде – в виде баз знаний, данных, репозиториев, каталогов и других сборников информации. Что потенциально дает возможность автоматизированной обработки этих данных, в отличие от данных, хранящихся не в компьютерном виде.
Так называемый процесс datamining (добыча информации) обозначает получение информации путем интеллектуального анализа уже накопленных данных. Интернет-технологии развились из стремления и идеи унифицировать и интегрировать между собой как процедуры и технологии обработки информации так и форматы ее хранения. Интернет выступил как всеобщая идея с одной стороны хранилища знаний, в котором они будут подчинены интеллектуальной системе хранения, и с другой стороны как идея создания глобального более или менее автоматизированного механизма помощи при принятии решений. И в частности – как идея – при принятии решений в области управления. Сейчас этот процесс развивается, и эти идеи разрабатываются.
Что такое СИОД и каковы перспективы и сложности их разработки
СИОД, или система интеллектуальной обработкиданных – это программно-аппаратная составляющая такого механизма, который может хранить информацию, интеллектуально анализировать ее и оказывать помощь в принятии управленческих решений.
Идея, которая была высказана только что выше, о системе интеллектуального хранения данных и механизме автоматизированной поддержки пользователей, ранее высказывалась специалистами как отдаленная перспектива, но сейчас становится все более актуальной, так как для ее реализации появляются технические средства. Это технологии облачных вычислений и платформы интеллектуального анализа данных, которые мы с вами рассмотрим ниже, в конце этой статьи и в следующих материалах.
А сейчас перечислим некоторые свойства СИОД, которые влияют на возможности разработки систем поддержки управленческих решений и разработку систем интеллектуального хранения и анализа информации. Акцент в данном случае будет сделан на программно-аппаратную составляющую – о ее проблемах и свойствах пойдет речь. В частности мы опишем причины, по которым методы и пути разработки СИОД должны быть другими, чем методы и пути разработки и развития других типов программно-аппаратных комплексов и систем:
- основой для систем СИОД являются идеи, методы и принципы искусственного интеллекта, на которых разработка и работа систем интеллектуальной обработки данных базируется как ИИС – интеллектуальная информационная система;
- технология и методология разработок СИОД зависит от специфики ИИ, искусственного интеллекта, и этим существенно усложняется, требуя во много раз больше различных ресурсов;
- одновременно с этими трудностями растет и интерес к ИИ, вместе с которым во все больших прикладных областях человеческой деятельности внедряются или начинают внедряться, рассматриваться как возможные для внедрения, интеллектуальные информационные системы, или ИИС;
- происходит постепенный выход на уровень промышленного использования и производства разработок различных систем искусственного интеллекта, таких как машинное зрение, машинный интеллектуальный перевод, системы datamining, экспертно-ориентированные системы и другие разработки. Все это постепенно приобретает характер индустрии;
- в результате таких серьезных разработок в этой области и начале их относительной массовости к этим интеллектуально ориентированным системам начинают применяться те же требования, которые применяются к традиционно использующимся программным продуктам и аппаратным средствам;
- выполнение этих требований и другие задачи усложняются тем, что интеллектуальные информационные системы требуют для своего производства более значительных, чем другие системы, затрат времени и труда;
- реализация идей в области искусственного интеллекта и создания СИОД связана также с проблемой выбора средств, использующихся для разработки СИОД – это отдельная задача, имеющая свою особую сложность;
- трудоемкие процессы производства и разработки систем интеллектуальной обработки данных не являются полностью разработанными и понятными, совершенствуются и разрабатываются в процессе работы, требуют вливания новых идей, новых интеллектуальных усилий и ресурсов, требует использования неординарных методов, средств и подходов, что также увеличивает сложность и время продуктивной работы в этой области;
- в связи с вышесказанным результативность работы в сфере СИОД определяется опытностью и талантами команд, которые работают с каждым из отдельных проектов.
Один из самых интересных и основных выводов в этой ситуации заключается в последнем пункте, а именно в том, что благодаря неординарной ситуации в работе с СИОД результаты работы над каждым отдельно взятым проектом и результативность этой работы определяются возможностями и опытом разработчиков, занимающихся этим проектом. То есть разные лаборатории и разные разработчики находятся в гораздо более не равных условиях, чем обычно, а результативность и скорость их работы определяются множеством разных факторов.
Уже упомянутые нами и еще не упомянутые системы искусственного интеллекта и машинного обучения, компьютерные экспертные системы, программные системы, основанные на алгоритмах интеллектуального анализа данных на данный момент определяют характер, черты и особенности современных аналитических информационных систем. В то же время у СИОД намечается отдельный путь развития, направленный на создание инструментов экспертной поддержки принятия решений.
В качестве эффективного инструмента экспертной поддержки принятия решений СИОД обладают следующими признаками, позволяющими их так рассматривать:
- для неформализованных проблемных областей СИОД способны к решению широкого круга задач;
- способны извлекать знания и создавать из них формализованные модели, пользуясь как источником базами данных и различными данными;
- способны моделировать интеллектуальную деятельность людей в ее механизмах, создавать модели интеллектуальных механизмов деятельности;
- способны применять к решению задач ряд эвристических методов;
- способны представлять объяснения полученных ими решений;
- способны применят знания из предметных областей;
- показывают высокую производительность.
СИОД демонстрируют и некоторые другие признаки, указывающие их пригодность и предназначенность для использования в качестве подспорья и автоматизированных систем для принятия решений в области управления и для использования их в области результативного интеллектуального анализа данных.
Технологии облачных вычислений – их общая сущность и типы использования
Интереса заслуживают технологии облачных вычислений, которые используются уже достаточно мощно и являются одной из платформ и основ для разработки систем интеллектуальной обработки данных и создания пространства для помощи в принятии программных и управленческих решений. Конспективно, насколько позволяет небольшой размер публикации и ее тип, опишем признаки систем облачных вычислений и их возможности и функции.
В первую очередь, так называемое «Облако», что это? «Облаком» теперь называется комплекс из множества виртуальных компьютеров, чья вычислительная мощность и некоторые характеристики могут очень быстро меняться по запросу пользователя. Это удаленный вычислительный комплекс, максимально быстро реагирующий на запросы пользователей, не имеющих доступа непосредственно к железу, по согласно конфигурации, могущих управлять программной частью.
Стандарты для вычислительных комплексов такого рода определяются Национальным институтом стандартов и технологий США, или NITS (NationalInstituteofStandardsandTechnology), в правилах для облачных технологий и комплексов, которые (правила) именуются как SAJACC, или StandardsAccelerationtoJumpstartAdoptionofCloudComputing.
Три основных типа услуг, которые предоставляются облачными вычислительными комплексами:
- softwareasaservice – услуги программного обеспечения. В этом случае пользователи используют облачный сервис в виде каких-то программ, работая с ними удаленно, как будто бы на своем компьютере. Таким образом сегодня можно пользоваться многими обычными приложениями, такими как Ворд или Фотошоп, офисными программами, а также С1, и многими специальными и специализированными программами. Пользователь имеет свою конфигурацию в этой программе, например свой настроенный интерфейс, и сама программа для использования имеет какую-то конфигурацию настройки;
- platformasaservice – услуга в виде платформы. На этом уровне пользователь также не имеет отношений с сетью компьютеров, с кластерами виртуальных машин и вычислительными мощностями более одного виртуального компьютера. Он пользуется только одной вычислительной машиной. Ее жестким диском неограниченного размера и ее вычислительно мощностью. Это использование облака как одного мощного удаленного компьютера, обладающего одним неограниченным диском для хранения и записи данных.
В случае с platformasaservice вся сеть компьютеров, образующих облако по запросу пользователя конфигурируется и предстает как единый компьютер со сверхмощным многоядерным процессором, неограниченной оперативной памятью и диском для данных неограниченного размера. Пользователь работает с одним такого типа кластером, собранным из множества виртуальных машин.
- infrastructure as a service – услуга инфраструктуры. Самая интересная конфигурация облачного сервиса, в которой пользователь получает в свое распоряжение множество, возможно неограниченное число виртуальных, полностью работающих компьютеров, и пользователь может сам, как ему угодно, настраивать конфигурацию каждого из них. Самое интересное в этом типе работы с облачной технологией, и видимо его основной смысл заключается в том, что сам пользователь при определенных условиях получает возможность полного управления облаком и конфигурирования из этих машин того кластера и той вычислительной мощности или конфигурации, которая ему может быть нужна.
На этой стадии, в этом типе использования, таком как infrastructureasaservice, можно говорить о широких возможностях использования облачных технологий как базы для конфигурирования мощных обрабатывающих данные кластеров и систем интеллектуальной обработки данных. Единственное, что отличает на данном этапе пользование облачной технологией от реального использования компьютеров – это то, что пользователь облачных виртуальных машин не имеет возможности контролировать железо, аппаратную часть компьютеров, а все остальное управление программной частью находится в его руках. И тогда все зависит от степени организации и ширины возможностей интерфейса.
Далее мы расскажем вам о платформах интеллектуального анализа данных, и о существующих сегодня стратегических планах и методах тех разработок СИОД, о которых мы говорили в этой статье. По всем вопросам компьютерных исследований и экспертиз компьютерных программ и оборудования, по вопросам анализа компьютерного программного обеспечения и аппаратных частей просим вас обращаться к нашим экспертным специалистам – по контактным данным АНО «Судебный эксперт».