Обсуждение:new-words
Материал из Xgu.ru
Thank you very much!!!
Содержание |
[править] Не работает под lenny64
user@deb64:~$ new-words http://en.wikipedia.org/wiki/Moscow Can't locate Lingua/Stem/Snowball.pm ...
После Гугления и борьбы с Перлом The following packages have unmet dependencies: liblingua-stem-snowball-perl: Depends: perl (>= 5.10.1-11) but 5.10.0-19lenny2 is installed.
- А так?
wget http://search.cpan.org/CPAN/authors/id/C/CR/CREAMYG/Lingua-Stem-Snowball-0.952.tar.gz tar xvfz Lingua-Stem-Snowball* cd Lingua-Stem-Snowball* perl Makefile.PL make sudo make install
Это ручная инсталляция модуля Stem::Snowball --Igor Chubin 15:35, 8 декабря 2010 (UTC)
[править] Python Stemmer
В новой версии (при установке из mercurial) используется не Perl'овый модуль, а Python'овский.
Stemmer
В Debian его можно поставить прямо из репозитория (python-stemmer).
igor:~/Langs/Deutsch/Der_kleine_Prinz$ apt-cache search stemmer python python-stemmer-dbg - Python bindings for libstemmer - snowball stemming algorithms (debug extension) python-stemmer - Python bindings for libstemmer - snowball stemming algorithms
Поставить из архива исходных текстов можно так:
$ wget http://snowball.tartarus.org/wrappers/PyStemmer-1.0.1.tar.gz $ tar xvfz PyStemmer-1.0.1.tar.gz $ cd PyStemmer-1.0.1 $ python setup.py build $ python setup.py install
[править] Регистр
А почему Ваша программа учитывает регистр? Например, LORD, Lord и lord она считает за разные слова.
- Потому что в некоторых языках эти слова действительно отличаются. Например, в немецком слово, начинающееся с прописной буквы и слово, начинающееся со строчной, это два разных слова. Они в словаре стоят отдельно, и иногда имеют даже совершенно несвязанные друг с другом значения. Согласен, что в большинстве случаев это не так. Надо добавить ключ, который будет выключать учёт регистра (все слова будут переводиться в нижний регистр). Пока же можно использовать ключ -c, скорее всего это то, что вам нужно. --Igor Chubin 09:09, 19 июня 2012 (CEST)
[править] Башизм
$ dash INSTALL.sh INSTALL.sh: 3: [: unexpected operator Installing new-words to /home/user/bin/ Done. $ bash INSTALL.sh Installing new-words to /home/user/bin/ Done.
Возможно, в первой строчке вместо "#!/bin/sh" стоит честно указать "#!/bin/bash"?