Анализ эффективности работы web-сайта



Скачать 117.4 Kb.
страница1/5
Дата23.07.2018
Размер117.4 Kb.
  1   2   3   4   5

УДК 004.838:004.853:004.855.5:004.738.5

АНАЛИЗ ЭФФЕКТИВНОСТИ РАБОТЫ WEB-САЙТА
С ПРИМЕНЕНИЕМ МЕТОДОВ ИАД

В.В. Хайлова1

В работе описывается разработанная автором система анализа поведения посетителей web-сайта с использованием методов интеллектуального анализа данных и наглядной интерпретацией полученных результатов. Система снабжена интеллектуальными функциями: кластеризация посетителей относительно выделенного целевого атрибута при помощи правил ДСМ, сгенерированных в программной среде QuDA и оценка качества страниц web-сайта методом нечеткого вывода.

Введение

В настоящее время для анализа поведения посетителей web-сайтов широко применяются системы учета статистики посещений, использующие рейтинговые показатели и критерии, построенные на основе подсчета количества обращений к web-страницам. Они отслеживают базовые числовые параметры, такие как посещаемость сайта за период времени, глубина просмотра сайта, источники входящего трафика и так далее. Эту информацию web-аналитик должен выявить и оценить самостоятельно и принимать решения на ее основе. Недостатками применения рейтинговых показателей являются то, что они не во всех случаях адекватно отражают степень популярности информационного ресурса и не могут помочь в оптимизации структуры web-сайта. Рост объема собираемой информации и увеличивающаяся сложность исследуемых объектов требует автоматизации анализа. Требуются средства для выявления закономерностей в поведении посетителей и классификации объектов сайта.

Более качественную информацию, используемую для повышения эффективности функционирования web-сайта, дает применение методов интеллектуального анализа данных.

Раздел ИАД, прикладной областью которого является Интернет, называется Web mining. Направление Web mining можно определить как поиск и анализ полезной информации в сети Интернет с применением методов интеллектуального анализа данных. Это направление включает три области исследования: Web content mining, web structure mining и web usage mining [Scime, 2005].

Область Web content mining занимается автоматизированным поиском и извлечением информации из содержимого или описания электронных документов, полученных из различных источников сети Интернет. Web structure mining – это процесс извлечения информации из структуры гиперссылок и перекрестных ссылок, отслеживание дефектов их структуры, анализ связей между ссылками и объектами ссылок. Web usage mining занимается изучением и анализом шаблонов взаимодействия посетителей с web-сайтами и web-сервисами [Cooley at al., 1997].

Данная работа относится к области Web usage mining. Эта область возникла около 10 лет назад, первыми работами можно считать исследования [Chen at al., 1996], [Mannila at al., 1996] и [Yan at al., 1996]. В настоящее время это направление бурно развивается во всем мире, к сожалению, в России она практически не представлена и открытых разработок по ней не ведется.

Можно выделить три основных метода ИАД, применяемых в области web: поиск ассоциативных правил [Elo-Dean at al., 1997], поиск последовательностей в цепочках перемещений (сессиях) посетителей по сайту [Mannila at al., 1996] и кластерный анализ, позволяющий группировать посетителей или структурные элементы сайта, имеющие схожие характеристики [Yan at al., 1996].

В настоящее время уже существует ряд коммерческих систем в большей или меньшей степени использующих методы ИАД. Примеры: Predictive Web Analytics (компания SPSS), HitsIntoLeads (компания NetMining) и другие. Такие системы приобретают все большую популярность. Это связано с тем, что растет потребность в средствах интеллектуального анализа данных, так как они позволяют автоматически извлекать из больших массивов данных полезные знания. Разработанная система также предоставляет такие возможности.

В созданной системе используются следующие методы интеллектуального анализа:


  • ДСМ-метод [Финн, 1983; Финн, 1991] применяется для кластеризации сессий посетителей и выявления возможных причин, по которым посетитель достигал или не достигал выбранных «целей» на сайте.

  • Нечеткий вывод [Zadeh, 1965] применяется для классификации страниц сайта. С помощью него оценивается качество страниц на основании текущих данных о посещениях. При этом, автор исходит из того, что по поведению посетителя на сайте можно судить о качестве навигационной структуры и контента, а так же соответствию представленной информации запросам посетителей.




Поделитесь с Вашими друзьями:
  1   2   3   4   5


База данных защищена авторским правом ©rekref.ru 2017
обратиться к администрации

    Главная страница