BBS :: Народный перевод Гарри Поттера



Утилита определения частоты появления слова в тексте [Edited]
Just
Ведьмочка
Откуда: Украина
Написано: 03.07.2004 21:07Инфо   Правка  
Ребята, прошу прощения, но год назад, когда только вышел "ГП и ОФ", кто-то подсчитал, сколько раз встречаются глаголы said, told и др. в тексте. Была, помнится, попытка доказать убогость текста и ответ на нее. Подсчеты проводились с помощью какой-то утилиты.
Эта утилита нужна дозарезу!!! Помогите!!!
To moderators: в архивах этого, к сожалению, нет…. А то, может, помните?
ответ сюда или на

 
ABC
Добби
Откуда: из научного трактата
Сообщений: 350
Написано: 04.07.2004 00:25Инфо   Правка  
Советую открыть текст во Всемогущем Word'е, выбрать меню Edit->Replace (Правка->Заменить).
В окошке "Find" (Найти) и в окошке "Replace with" (Заменить на) вписать нужное слово, если нужно, выбрать необходимые параметры (Match case, Whole word etc). Нажать на кнопочку Replace All (Заменить всё).
Произведённое число замен и будет указывать на то, сколько раз встретилось слово в тексте.

Статистику об общем числе слов, абзацев и т. д. можно получить в меню "Сервис->статистика". : chih :
 
nwanomaly
Маг вне категорий
Откуда: Северо-Запад
Сообщений: 95
Написано: 04.07.2004 01:35Инфо   Правка  
Just
Я когда-то попытался для себя сам такую прогу написать , но всё заглохло на выделении корня слова Помнится, я тогда в яндексе или рамблере набрал что-то вроде "частотные свойства руского языка" или как-то так… Была дано несколько хороших ссылок. Дерзайте, это вообще-то полезная вещичка
ABC
Вы ещё и орфографию в ворде предложили бы проверить


 
ABC
Добби
Откуда: из научного трактата
Сообщений: 351
Написано: 04.07.2004 01:48Инфо   Правка  
nwanomaly
имел в виду только английский язык
 
Нейтрон
Администратор
Откуда: Glasgow, UK
Написано: 04.07.2004 02:11Инфо   Правка  
Цитата:
Word counting statistics for ootp.txt

said : 3929
told : 230
book : 33
say : 216
spoke : 47
Harry : 4131
Ron : 1304
Hermione: 1307
Draco : 26
Potter : 283
Order : 107
Army : 14

———
Generated by Neutron word counter


Добавление от 04.07.2004 05:25:

free download
 
Just
Ведьмочка
Откуда: Украина
Написано: 05.07.2004 13:28Инфо   Правка  
ABC
Про возможности Ворда я в курсе… Хотелось бы оптимизировать процесс.

Добавление от 05.07.2004 13:35:

Нейтрон
Спасибо!!! Постараюсь применить, хотя у меня, чесно говоря, Win200Pro.

Добавление от 05.07.2004 13:37:

nwanomaly
В Яндексе и Гугле пробовала… И продолжаю пробовать. "Частотные свойства…" тоже счаз опробую. Спасибо.
 
Нейтрон
Администратор
Откуда: Glasgow, UK
Написано: 05.07.2004 16:39Инфо   Правка  
Just
Есть версия 2.0, которая работает без словаря.
code:
Word counting statistics for OotP.txt 

11810 the
6238 and
4131 harry
3929 said
3668 you

58 hearing
58 alone
58 mum
———
Total words: 267150
Words found: 11861
Displayed 500 most frequent

———
Generated by Neutron word counter version 2.0



Добавление от 05.07.2004 18:35:

code:
Word counting statistics for BOOK5rus.a.txt 

4185 гарри
3743 что
1637 как
1468 его
1252 это
1124 она
971 эрмиона

44 окна
44 продолжил
44 ответ
44 таки
———
Total words: 216549
Words found: 31685
Displayed 500 most frequent

———
Generated by Neutron word counter version 2.0


download Neutron word counter version 2.0

Добавление от 05.07.2004 21:09:

Ещё вот: http://forum.ixbt.com/topic.cgi?id=23:10245

Добавление от 05.07.2004 21:10:

И вот: http://forum.ixbt.com/topic.cgi?id=23:10114
 
серегаНаписано: 09.11.2004 11:01Правка  
здраствуйте всем!!! помогите найти тему коммуникативные и структурные свойства русского языка ! заранее спасибо!!!

Добавление от 09.11.2004 11:07:

Нейтрон
вы мне поможете7???
 
Статус   Подклеить  

Новая темаСписок темЧатНародный переводЗеркалоНаписать администрации


Copyright © 2002-2006. Нейтрон. www.yarik.com
All Rights Reserved.
При разработке форума были использованы некоторые идеи и наработки MN и forum.iXBT.com
Иконки для форума любезно предоставил DELer
Отказ от гарантий     Правила