MySQL синонимайзер
У меня часто возникала необходимость синонимизировать тексты из бд MySQL.
Экспортировать базу, крошить ее на тексты, обрабатывать каждый текст и потом снова собирать базу - путь достойный восхищения, но требует слишком много времени и усилий.
Поэтому я написал для себя небольшой синонимайзер, работающий напрямую с базой.
Были планы превратить существующие наработки в платный проект, но не хватает времени.
Выкладываю "как есть", никаких претензий по программе не принимаю.
http://depositfiles.com/files/vmy9xrez4
Возможны доработки и адаптация программы под ваши нужды на коммерческой основе.
-
Указываем настройки соединения с базой (имя базы, логин пользователя, пароль и сервер баз данных).
Жмем "Соединиться с БД" -
Выбираем нужную таблицу в базе.
-
Выбираем поле, содержимое которого необходимо синонимизировать.
-
Выбираем "ключ" и указываем диапазон.
Попытаюсь объяснить, что я спрятал за этими словами на примере запроса, которые сгенерирует программа.
Например вы задали:
Имя таблицы - ТАБЛИЦА
Имя ключа - КЛЮЧ
Диапазон - от 5 до 20Тогда запрос программы к базе для получения текста будет выглядеть так:
SELECT * FROM ТАБЛИЦА WHERE КЛЮЧ = x , и х последовательно будет увеличивать в диапазоне от 5 до 20.Т.е., проще говоря по полю, заданному вами как "ключ" будет осуществляться "шагание" по таблице.
-
Выбираем словарь, используя кнопку "Выбрать словарь" и нажимаем старт.
Ползунок в правом-нижнем углу окна программы будет показывать ход выполнения.
Отдельно несколько слов о формате словарей, который использует программа. Файл может быть любого расширения, важна структура данных.
[words]
слово 1 = синоним 1
....
....
слово N = синоним N
Используйте встроенный редактор словарей для создания небольших тематических словарей. Мой опыт показывает, что всего ~200 синонимов достаточно, чтобы добиться 10-15% замены слов.
Помните - морфология русского языка не учитывается.
!UPD: В синонимайзере нашлись серьезные баги, править которые мне на на данный момент кажется бессмысленным, т.к. просто не до него. Если у вас получится им воспользоваться - рад за вас, если нет, уж извините..
- Категории:
- 309 просмотров
Комментарии
а ссылка на депозит не рабочая-то...
перезалей плз, а то файла такого на депозите уже нет...
заменил
Да прикольная штука зтот MySQL синонимайзер, но я вот на днях наткнулся на скрипт синонимайзера который написан на php, не использует базы данных, база синонимов находится в php файле и доступна для редактировании. При обработке теста скрипту не важно написано слово с большой буквы или с маленькой, стоит ли после или перед словом знак препинания. В скрипте предусмотрена функция добавления в базу слов и словосочетаний неограниченной длинны даже со знаками препинания. Вся база синонимов скрипта уникальна и собранна в ручную с учетом морфологии, в ней находится более 91 000 слов и словосочетаний, благодаря этому на выходе получатся на 80% - 90% читаемый текст без искажения смысла. Уникальной особенностью данного скрипта является то, что при размере базы почти в 100 000 слов и соответственно столько же синонимов к ним, скрипт обрабатывает текст за доли секунд, благодаря чему данный скрипт можно использовать как функцию и получать на выходе уже синонимизированный текст. Пример работы скрипта: http://www.phpsin.ru/sinonim/
Правда за этот скрипт просят денег, немогу определиться купить или нет что скажите?
да иди ты нафиг
точно, заколебал
Пораскидал рекламу своего
http://www.phpsin.ru/sinonim/
По всему Инету
Столько сайтов загадил
Добавить комментарий