![]() |
![]() |
Tirion 03.06.2004 - 12:39 |
В общем ситуевина такая: Есть обзоры рассылок, дамп форума, и официальные документы. Нужно сделать так, чтобы при обращении к какому-либо разделу Обзоров динамически создавались ссылки на Оф. доки содержащие инфу, которая упоминается в данном разделе обзора и соответственно, на тему форума, где обсуждается подобный вопрос. Например я захожу в обзор, выбираю нужный мне раздел с определенной инфой, а на странице генерятся ссылки на доки и форум, где еще есть упоминания об этой инфе... В общем просто не знаю, как лучше всего это проделать, чтоб не тратить массу времени. Мож подкинет кто-нибудь идейку? |
Zeratul 1 - 03.06.2004 - 12:47 | Никак :) Судя по описанию требуется лингвистический анализ текста. Яндекс еще даже до этого не дорос... |
Lucifer 2 - 03.06.2004 - 12:47 |
Вариант: Перелопачиваешь все свои офиц доки, делаешь базу данных и загоняешь в неё текст этих документов (НО убираешь повторяющиеся слова, слова короче 3 букв...). табличка с записью на каждый документ. В одном столбце сам документ (уже обработаный как я выше написал), ссылка на документ.. ну и ещё что нибудь.. id,.. Далее пишешь скрипт поиска. Поиск будешь осуществлять сразу по столбцу из таблицы с доками и по таблице где хранятся твои сообщения форума... вроде как и всё |
Tirion 3 - 03.06.2004 - 12:56 |
to Lucifer В принципе это можно сделать, только получится очень громоздко. Ведь так же можно было сделать поиск по тексту с генерацией ссылок в случае успеха (искать придется конкретные вариации ака номера статей или заголовки), но в обоих случаях значительно снизится скорость обработки. Проблема еще и в том, что нужно максимально автоматизировать процесс добавления информации. |
Mips 4 - 03.06.2004 - 16:43 |
При добавлении статьи делаешь ещё одно поле для ключевых слов. Поиск в доках и постах форума будет вестись по ключевым словам статьи (из поля) Мини-лингвистический анализ можно сделать отбросив некоторые окончания у прилагательных (ие,ия,ию,ии,ий,ый,ые,ая...), а также у существительных (и,е,я,а,ы,у,ов,ок,ях,ах,ями,ами...) и у глаголов убираешь "-ся". Если дружишь с RegExp, то окончания можно не отбрасывать, а перебирать(в конце может быть такая буква или такая или такая). Чем круче лингвистика, тем больше код, тем медленнее обработка. Главное не юзать ereg-функции(preg на порядок быстрее). ps: А никто и не говорил, что будет легко :) |
Tirion 5 - 03.06.2004 - 16:59 |
А самое смешное, что это будет ПО для диска... :) Поэтому нуна уложится в 700 Mb вместе с контентом и инсталлом Во как... |