АвторСообщение





Пост N: 116
Зарегистрирован: 22.08.11
Рейтинг: 1
ссылка на сообщение  Отправлено: 29.03.15 12:00. Заголовок: Как быстро и качественно подготовить текст


1 Надо скачать словари Мои словари и excword, эти словари уменьшат поиск новых слов и омографов. (в принципе это не обязательно, но тогда подготовка текста может затянуться)

2 Открываем текст, проверяем его словарями только Римские, Числительные, clean и сохраняем его


3 Открываем окно отладки проекта


переходим в режим Отображать обработанный словарями текст проекта, выделяем все и копируем текст


создаем новый текстовый файл и вставляем туда скопированный текст


4 Открываем новый созданный файл, открываем панель поиска и замены (бинокль рядом с режимом редактирования) и переходим в Режим отображение текста - редактирование


редактируем текст рег выражением - в найти пишем \bвсе([\,.!?]) - в заменить на пишем всё$1 ( это быстрый поиск и замена все со знаками препинания, так как оно может читать в одно и том же месте по разному)

если надо заменить на всё жмем кнопку заменить и найти следующее, если не надо жмем поиск в перед

5 После редактирования сохраняем текст в режиме Только чтение


проверяем его всеми словарями кроме 09Омографы


6 Ищем в тексте новые слова


в настройках выбираем все слова, скрыть имеющиеся в словарях, скрыть имеющиеся в списке исключений

(новые слова которые встречаются в тексте 1 раз я даже не проверяю, обычно на книгу 8 часов новых слов получается около 100-150)

7 Открываем Отладку проекта в режиме Отображать обработанный словарями текст проекта и в строку поиска вставляем
Скрытый текст

он покажет все Омографы в которых не проставилось ударение (обычно на книгу 8 часов это где то 150-200 омографов)

создаем свой словарь


и добавляете в свой словарь те омографы которые вы найдете в тексте

(в моем словаре 09Омографы большенство их идут в единственном числе, головы<, горы<( исключения глаза<, ру<ки, но<ги, слёзы - они во множественном числе)

8 Выбираем все словари и 09Омографы тоже и проверяем заново текст книги



Все текст готов, как показала практика, на книгу 8 часов при прослушивание всего 40-50 слов будет прочитано не правильно, такая обработка текста у меня занимает от 30 до 50 минут, в зависимости от книги.



Спасибо: 0 
ПрофильЦитата Ответить
Ответов - 27 , стр: 1 2 All [только новые]







Пост N: 18
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 09.06.15 01:41. Заголовок: Пожалуйста, выложите..


Пожалуйста, выложите кто-нибудь профили к программе, чтобы было с чем сравнить.... И кстати, в версии [v2.1.2.1416] 15.05.2015 в режиме Настройки программы -> Настройки -> Синтез речи -> Паузы нет тире, то есть невозможно выставить паузу перед, к примеру, выражение Сактывкар - (пауза 150 мс) город и т.д. Это очень печально. Может стоиить это исправить?

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 128
Зарегистрирован: 22.08.11
Рейтинг: 1
ссылка на сообщение  Отправлено: 09.06.15 19:15. Заголовок: точно не знаю какой ..


точно не знаю какой файл отвечает за профили, возможно это файл settings

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 1
Зарегистрирован: 30.04.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 06.05.16 01:12. Заголовок: Есть вопросы: 1. ред..


Есть вопросы:
1. редактируем текст рег выражением - в найти пишем \bвсе([\,.!?]) - в заменить на пишем всё$1 ( это быстрый поиск и замена все со знаками препинания, так как оно может читать в одно и том же месте по разному), - а если вначале задействовать словарь(и) все-всё ?
2. Поиск новых слов + омографы, - при такой!!! базе вылавливать "неправильные" слова и использовать очень малое количество омографов???
...
Спасибо за словари омографов, пользуюсь голосом ИВОНА Максим, словари переделал в основном.
Вопросы ещё есть(много), но по мере поступления...


Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 60
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 06.05.16 11:08. Заголовок: wasyaka пишет: 1. р..


wasyaka пишет:

 цитата:
1. редактируем текст рег выражением - в найти пишем \bвсе([\,.!?]) - в заменить на пишем всё$1 ( это быстрый поиск и замена все со знаками препинания, так как оно может читать в одно и том же месте по разному), - а если вначале задействовать словарь(и) все-всё ?


у меня это организовано следующим образом. Поскольку слово всё встречается чаще чем слово все, то в словаре омографов. который идёт в самом конце списка словарей, я установил все=всё.
в словаре регулярных выражений оставил только правила, в основном исправляющие все на все. т.е. все=всеъ. Надеюсь я ответил на ваш вопрос. Поиск данного омографа в режиме отладка проекта выполняю включив в поиске регулярное выражение /bвсе/b - и далее по мере необходимости добавляю правила в словарь все->всеъ

wasyaka пишет:

 цитата:
2. Поиск новых слов + омографы, - при такой!!! базе вылавливать "неправильные" слова и использовать очень малое количество омографов???



посмотрите это - ссылка и и пост № 159

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 2
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 22.07.16 09:57. Заголовок: MoppoH пишет: новые..


MoppoH пишет:


 цитата:
новые слова которые встречаются в тексте 1 раз я даже не проверяю, обычно на книгу 8 часов новых слов получается около 100-150



Это из оставшихся по одному в среднем полторы тысячи (у меня, при использовании голоса ИВОНА - МАКСИМ), и как их , выбрав при прослушке "неправильные", добавить в список исключений?

Словаоь "02 самом" - какя понял, должен менять заглавную букву в омографах на прописную - у меня меняет только в серелине строки, а если начальная - нет.(или так и задумано? - смысл?)

Поступил проще:
$Ангара=ангара
и т.д.


Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 1
Зарегистрирован: 05.06.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 23.07.16 23:44. Заголовок: wasyaka пишет: долж..


wasyaka пишет:

 цитата:
должен менять заглавную букву в омографах на прописную - у меня меняет только в серелине строки, а если начальная - нет.


так и задумано, потому что чаще всего если предложение начинается с омографа то он во множественном числе.
wasyaka пишет:

 цитата:
выбрав при прослушке "неправильные", добавить в список исключений?



добавляет в словарь исключений который находится в корневой папке программы называется excwords

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 3
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 24.07.16 13:42. Заголовок: выбрав при прослушке..



 цитата:
выбрав при прослушке "неправильные", добавить в список исключений?


Имелось ввиду после записи. Как в MP3book2005 > Поиск новых слов > Сохранить в файл.
Здесь такое возможно?

http://shot.qip.ru/00QDGw-5lA1oXmp5/

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 1
Зарегистрирован: 24.07.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 24.07.16 21:55. Заголовок: зачем сохранять в сп..


зачем сохранять в список исключений слова которые ты еще не прослушал? при нажатие на тот крестик слово автоматом сохраняется в этот словарь

Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 71
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 24.07.16 22:56. Заголовок: wasyaka пишет: $Анг..


wasyaka пишет:

 цитата:
$Ангара=ангара



В этом случае, вы из обычного нарицательного существительного дополнительно получаете омограф, который может читаться по разному (стало 2 варианта: сама река Ангара, ангАра (р.п. слова ангАр)), в зависимости от контекта.
Не советую выполнять такие ообобщающие решения.

лучше вместо выражения $Ангара=ангара использовать решулярное выражение

#(?-i)\bАнгар([ауыео])?([а-я]{1,5})?\b=Ангар$1<$2

Подобный тип регулярки можно использовать и во всех других словах, где ударение скачет по слогам.

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 72
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 24.07.16 23:05. Заголовок: Что-то много Морроно..


Что так много Морронов (MoppoH, HoqqoM, MoppoH2) то расплодилось?

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 4
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 25.07.16 13:56. Заголовок: MoppoH пишет: новые ..


MoppoH пишет:

 цитата:
новые слова которые встречаются в тексте 1 раз я даже не проверяю, обычно на книгу 8 часов новых слов получается около 100-150



 цитата:
зачем сохранять в список исключений слова которые ты еще не прослушал? при нажатие на тот крестик слово автоматом сохраняется в этот словарь



Я их прослушал в "записи", и выписал 100-150 новых "неправильных"слов. Остальные от 1000 до 2000 прозвучали "правильно", и чтобы поновой их не слушать и "не нажимать на тот крестик(правильные, зачем?)," как их добавить в словарь excwords?
Исходя из того что в дальнейшем эти слова могут встречатся более одного раза.
В MP3book2005 я по новой включил поиск новых слов, сохранил их и добавил в known_words, аналог excwords.
Для голоса Ивона ударения делаются заглавной буквой через словарь фонем. В koobaudio это делать удобней.
И как добавить фото, а то только ссылка получается?

odinokiyklaus пишет:

 цитата:
В этом случае, вы из обычного нарицательного существительного дополнительно получаете омограф, который может читаться по разному (стало 2 варианта: сама река Ангара, ангАра (р.п. слова ангАр)), в зависимости от контекта.
Не советую выполнять такие ообобщающие решения.

лучше вместо выражения $Ангара=ангара использовать решулярное выражение

#(?-i)\bАнгар([ауыео])?([а-я]{1,5})?\b=Ангар$1<$2

Подобный тип регулярки можно использовать и во всех других словах, где ударение скачет по слогам.



Для "Николая" да, а для "Максима"...

Для разметки(расстановки) омографов с ударением заглавной буквой есть классная прога: click here
Так что это с учётом того что эти два слова совместно встречаются редко (ангар(А,У,Е,Ы) - вообще дефицит),а слово в тексте ангар([ауыео])( звучить как ангАр([ауыео]), - пропустил и ОК.

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 2
Зарегистрирован: 24.07.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 25.07.16 19:25. Заголовок: odinokiyklaus пишет:..


odinokiyklaus пишет:

 цитата:
Что так много Морронов (MoppoH, HoqqoM, MoppoH2) то расплодилось?


не могу восстановить пароль от MoppoH

wasyaka пишет:

 цитата:
и чтобы поновой их не слушать и "не нажимать на тот крестик(правильные, зачем?)," как их добавить в словарь excwords?



выбрав эти два пункта слова из всех словарей уже не будет показывать в списке новых слов

Ангара не было видно. да такое выражение заменит на Ангара<, когда я встречаю такое в тексте я просто добавляю в регулярное выражение сочетание |не было| и в следующий раз читать будет нормально, а если мы добавим правило ангар=анга<р и будет книга что много раз будет встречаться название Ангара, то добавить такое уже тяжело в рег выражения

wasyaka пишет:

 цитата:
И как добавить фото, а то только ссылка получается?


залей на хостинг картинку и нажми эту кнопку и вставь туда ссылку


Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 5
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 25.07.16 20:13. Заголовок: MoppoH2 пишет: выбра..


MoppoH2 пишет:
[quote]выбрав эти два пункта слова из всех словарей уже не будет показывать в списке новых слов

Не то.


2464 слова остались не прослушанными (по одному - трата времени).
После записи книги и прослушки оказалось 164 слова из 2464 неправильно произносящихся.
Исправил - добавились в словарь, а оставшиеся 2300 правильных, как их извлеч из редактора и добавить в список excwords.

так в MP3book2005



Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 3
Зарегистрирован: 24.07.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 25.07.16 22:34. Заголовок: с этим предложением ..


с этим предложением сюда
http://koobaudio.borda.ru/?1-3-0-00000016-000-0-0-1461839524

Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 73
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 26.07.16 16:33. Заголовок: wasyaka пишет: Для ..


wasyaka пишет:

 цитата:
Для разметки(расстановки) омографов с ударением заглавной буквой есть классная прога: click here


Ух ты! что-то новенькое . Посмотрим-посмотрим

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 4
Зарегистрирован: 24.07.16
Рейтинг: 0
ссылка на сообщение  Отправлено: 26.07.16 20:13. Заголовок: odinokiyklaus пишет:..


odinokiyklaus пишет:

 цитата:
Ух ты! что-то новенькое . Посмотрим-посмотрим



посмотрел эту программу с заменой омографов, ее главный недостаток, это что она добавляет только словосочетания, загрузив текст книги, где у меня выдало после обработки словарями всего 174 омографа, эта программа предложила мне просмотреть 2889 необработанных омографов. наверное чтобы обработать все омографы надо потратить столько же времени сколько займет прочитать эту книгу


Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 16
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 02.09.16 21:43. Заголовок: MoppoH2 пишет: odin..


MoppoH2 пишет:

 цитата:
odinokiyklaus пишет:

 цитата:
Ух ты! что-то новенькое . Посмотрим-посмотрим



посмотрел эту программу с заменой омографов, ее главный недостаток, это что она добавляет только словосочетания, загрузив текст книги, где у меня выдало после обработки словарями всего 174 омографа, эта программа предложила мне просмотреть 2889 необработанных омографов. наверное чтобы обработать все омографы надо потратить столько же времени сколько займет прочитать эту книгу



Прога используется после обработки словарями. остаток так сказать. и при использовании фильтра можно менять "пачкой."
Удобно для редко втречаемых и "сложнословарных" омографов типа вАлите=валИте; нахОдиться=находИться(Беспрепятственно нахОдиться(находИться) на воде,) и т. д.

Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 25
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 12.12.16 19:34. Заголовок: Привет. Как избавитс..


Привет.
Как избавится от появление в обрабатываемом тексте (вкл. режим чтения) от <em>?
Как из я знаю

Спасибо: 0 
ПрофильЦитата Ответить





Пост N: 101
Зарегистрирован: 29.03.13
Откуда: Санкт-Петербург
Рейтинг: 0
ссылка на сообщение  Отправлено: 14.12.16 12:52. Заголовок: wasyaka пишет: Прив..


wasyaka пишет:

 цитата:
Привет.
Как избавится от появление в обрабатываемом тексте (вкл. режим чтения) от <em>?



Привет. На этот счет у меня есть вот такое правило. Его требуется разместить в предварительную обработку в числе самых первых, например в словарь 0.0_clean (он у меня самый первый в папке 1)
у меня данные правила в словаре описаны так:

// удаляем вставки в текст (файлы fb2) вида <em>бла..бла..</em>, <img>1</img>
#<img>\d+</img>=
#(\<[\/]?img\>)=
#(\<[\/]?em\>)=

В поисках рая.. Спасибо: 0 
ПрофильЦитата Ответить



Пост N: 30
Зарегистрирован: 30.04.16
Откуда: ЛНР, краснодон
Рейтинг: 0
ссылка на сообщение  Отправлено: 25.03.17 07:57. Заголовок: Привет. Вопрос (фот..


Привет.
Вопрос (фото почему-то не катит)
В окне"Результат обработки словарями" проставляется точка после названия. а в окне "Показать обработанный текст" их нет.
Не срабатывают правила:
#(([A-Za-zА-яЁё]+)\s\d+)(\r+)=$1.
#([A-Za-zА-яЁё]+)(\r+)=$1.

Почему исчезают точки?

Спасибо: 0 
ПрофильЦитата Ответить
Ответов - 27 , стр: 1 2 All [только новые]
Ответ:
1 2 3 4 5 6 7 8 9
большой шрифт малый шрифт надстрочный подстрочный заголовок большой заголовок видео с youtube.com картинка из интернета картинка с компьютера ссылка файл с компьютера русская клавиатура транслитератор  цитата  кавычки моноширинный шрифт моноширинный шрифт горизонтальная линия отступ точка LI бегущая строка оффтопик свернутый текст

показывать это сообщение только модераторам
не делать ссылки активными
Имя, пароль:      зарегистрироваться    
Тему читают:
- участник сейчас на форуме
- участник вне форума
Все даты в формате GMT  3 час. Хитов сегодня: 2
Права: смайлы да, картинки да, шрифты да, голосования нет
аватары да, автозамена ссылок вкл, премодерация откл, правка нет