К списку форумов К списку вопросов
Вопрос по PHP. Нужен совет по реализации.
Tirion
03.06.2004 - 12:39
В общем ситуевина такая:
Есть обзоры рассылок, дамп форума, и официальные документы.
Нужно сделать так, чтобы при обращении к какому-либо разделу Обзоров
динамически создавались ссылки на Оф. доки содержащие инфу, которая упоминается в данном разделе обзора и соответственно, на тему форума, где обсуждается подобный вопрос.
Например я захожу в обзор, выбираю нужный мне раздел с определенной инфой, а на странице генерятся ссылки на доки и форум, где еще есть упоминания об этой инфе...
В общем просто не знаю, как лучше всего это проделать, чтоб не тратить массу времени.
Мож подкинет кто-нибудь идейку?
Zeratul
1 - 03.06.2004 - 12:47
Никак :) Судя по описанию требуется лингвистический анализ текста. Яндекс еще даже до этого не дорос...
Lucifer
2 - 03.06.2004 - 12:47
Вариант: Перелопачиваешь все свои офиц доки, делаешь базу данных и загоняешь в неё текст этих документов (НО убираешь повторяющиеся слова, слова короче 3 букв...).
табличка с записью на каждый документ. В одном столбце сам документ (уже обработаный как я выше написал), ссылка на документ.. ну и ещё что нибудь.. id,..
Далее пишешь скрипт поиска. Поиск будешь осуществлять сразу по столбцу из таблицы с доками и по таблице где хранятся твои сообщения форума... вроде как и всё
Tirion
3 - 03.06.2004 - 12:56
to Lucifer В принципе это можно сделать, только получится очень громоздко.
Ведь так же можно было сделать поиск по тексту с генерацией ссылок в случае успеха (искать придется конкретные вариации ака номера статей или заголовки), но в обоих случаях значительно снизится скорость обработки.
Проблема еще и в том, что нужно максимально автоматизировать процесс добавления информации.
Mips
4 - 03.06.2004 - 16:43
При добавлении статьи делаешь ещё одно поле для ключевых слов.
Поиск в доках и постах форума будет вестись по ключевым словам статьи (из поля)
Мини-лингвистический анализ можно сделать отбросив некоторые окончания у прилагательных (ие,ия,ию,ии,ий,ый,ые,ая...), а также у существительных (и,е,я,а,ы,у,ов,ок,ях,ах,ями,ами...) и у глаголов убираешь "-ся". Если дружишь с RegExp, то окончания можно не отбрасывать, а перебирать(в конце может быть такая буква или такая или такая). Чем круче лингвистика, тем больше код, тем медленнее обработка. Главное не юзать ereg-функции(preg на порядок быстрее).
ps: А никто и не говорил, что будет легко :)
Tirion
5 - 03.06.2004 - 16:59
А самое смешное, что это будет ПО для диска... :)
Поэтому нуна уложится в 700 Mb вместе с контентом и инсталлом
Во как...

К списку вопросов на форуме Веб-дизайн

>>