YaCy
Материал из Xgu.ru
YaCy -- это распределенный поисковик с открытым исходным кодом, написанный на Java и построенный по принципу распределенной одноранговой сети.
Сайт проекта: http://yacy.net
Есть клиенты для Windows, Linux и MacOSX.
Поддерживает кеширующий прозрачный прокси, т.е. все страницы, через него посещенные, будут проиндексированы.
Имеет три основных режима работы:
- Нода распределенной поисковой сети. В этом режиме нода обменивается с другими нодами индексом сайтов посредством DHT, делая возможным поиск в интернете без цензуры поисковой сети.
- Изолированая нода. Не подключена к распределенной сети и ведет поиск только по своему индексу. Может быть использована для поиска по своему сайту или создания своего узкоспециализированного поискового ресурса.
- Поиск в интранет. Можно сделать поисковый портал для интранет-сети или веб-страниц, или распределённой файловой системы. URL-адреса могут быть использованы с HTTP/HTTPS/FTP и локальным именем домена или IP-адресом, или ссылки file:///<path> или smb://<server>
[править] Установка
Проста до безобразия и сводится к распаковке архива с исполняемыми файлами и запуску соответствующего скрипта. Например, так:
cd /tmp wget http://yacy.net/release/yacy_v1.72_20140506_9000.tar.gz tar -xvf yacy_v1.72_20140506_9000.tar.gz adduser yacy mv yacy/* /home/yacy/ cd /home/yacy/ chown -R yacy:yacy * su yacy ./startYACY.sh
Сервис поднимется на 8090 порту, поэтому, если ты хочешь участвовать в глобальной поисковой сети, нужно его открыть в файрволе. В случае, если этот порт не получается открыть по каким-то причинам, ты можешь попробовать перенаправить его на 80 следующей командой:
iptables -t nat -A PREROUTING -p tcp --dport 80 -j REDIRECT --to-port 8090
На некоторых системах нужно предварительно включить доступ к используемым портам, примерно таким образом:
iptables -I INPUT -m tcp -p tcp --dport 8090 -j ACCEPT
Доступ к админке по умолчанию происходит без запроса пароля, в случае если запрос происходит с того же хоста. Если ты хочешь запустить сервис на удаленном сервере, то имей ввиду что пароль для удаленного доступа в админку автоматически генерируется через 10 минут после запуска, и чтобы не потерять доступ к оной, тебе следует сразу озаботиться его установкой. (По крайней мере, так написано в документации, лично у меня пароль устанавливался практически сразу, поэтому, на мой взгляд, лучше развернуть ее сначала на рабочем компьютере, настроить и после этого уже переносить на сервер). |
[править] Производительность
Заявленные минимальные системные требования -- 256мб ОЗУ и [TODO]Мг ЦП. При настройках по умолчанию резервирует 600мб ОЗУ и загружает старенький двухядерный АМД в среднем где-то процентов на 40.