Обсуждение:new-words

Материал из Xgu.ru

Перейти к: навигация, поиск

Thank you very much!!!

Содержание

[править] Не работает под lenny64

user@deb64:~$ new-words http://en.wikipedia.org/wiki/Moscow Can't locate Lingua/Stem/Snowball.pm ...

После Гугления и борьбы с Перлом The following packages have unmet dependencies: liblingua-stem-snowball-perl: Depends: perl (>= 5.10.1-11) but 5.10.0-19lenny2 is installed.

А так?
wget http://search.cpan.org/CPAN/authors/id/C/CR/CREAMYG/Lingua-Stem-Snowball-0.952.tar.gz
tar xvfz Lingua-Stem-Snowball*
cd Lingua-Stem-Snowball*
perl Makefile.PL
make
sudo make install

Это ручная инсталляция модуля Stem::Snowball --Igor Chubin 15:35, 8 декабря 2010 (UTC)

[править] Python Stemmer

В новой версии (при установке из mercurial) используется не Perl'овый модуль, а Python'овский.

 Stemmer

В Debian его можно поставить прямо из репозитория (python-stemmer).

igor:~/Langs/Deutsch/Der_kleine_Prinz$ apt-cache search stemmer python
python-stemmer-dbg - Python bindings for libstemmer - snowball stemming algorithms (debug extension)
python-stemmer - Python bindings for libstemmer - snowball stemming algorithms

Поставить из архива исходных текстов можно так:

$ wget http://snowball.tartarus.org/wrappers/PyStemmer-1.0.1.tar.gz
$ tar xvfz PyStemmer-1.0.1.tar.gz
$ cd PyStemmer-1.0.1
$ python setup.py build
$ python setup.py install

[править] Регистр

А почему Ваша программа учитывает регистр? Например, LORD, Lord и lord она считает за разные слова.

Потому что в некоторых языках эти слова действительно отличаются. Например, в немецком слово, начинающееся с прописной буквы и слово, начинающееся со строчной, это два разных слова. Они в словаре стоят отдельно, и иногда имеют даже совершенно несвязанные друг с другом значения. Согласен, что в большинстве случаев это не так. Надо добавить ключ, который будет выключать учёт регистра (все слова будут переводиться в нижний регистр). Пока же можно использовать ключ -c, скорее всего это то, что вам нужно. --Igor Chubin 09:09, 19 июня 2012 (CEST)

[править] Башизм

$ dash INSTALL.sh 
INSTALL.sh: 3: [: unexpected operator
Installing new-words to /home/user/bin/
Done.

$ bash INSTALL.sh 
Installing new-words to /home/user/bin/
Done.

Возможно, в первой строчке вместо "#!/bin/sh" стоит честно указать "#!/bin/bash"?