Новое начало или тотальный копипаст ч.2
На сохранение 1 000 000 страниц. с различных сайтов требуется около 20 Gb жесткого пространства. Подсчет не точный.
Вот подумалось, а как лучше пройтись по всему рунету? Задумался я тут надысь над созданием своего поисковика. Так как для меня такая задача не совсем тривиальная, то решил посоветоваться. Как его можно организовать? Первое что пришло в голову это подсчитать требуемое место для контента страниц. Второе база, есть ли смысл использовать mysql или искать что-то другое? В каком порядке обходить сайты? первое что пришло в голову последовательный перебор. Как сложить все в базу я понимаю, а вот как организовать потом быстрый поиск не до конца. Если брать mysql то в одну таблицу все не влезет, да и поиск по ней будет утопией. Если есть у кого какие мысли, поделитесь? |
Цитата:
SQL-базы хороши до тех пор, пока вам не надо их расширять более чем на один сервер, из-за высокой нагрузки. с добавлением новых серверов, служебный траффик между ними значительно растет, и достаточно быстро превысит какие-либо разумные рамки. google к примеру использует свою собственную не-SQL базу. благодаря этому они могут держать сотни тысяч серверов в одном дата-центре. в качестве альтернативы SQL обычно приводятся key-value базы. они практически безболезнено могут быть расширены до кластера из любого количества серверов. PS а вообще, идею нахожу бредовой. Это слишком науко- и финансово- емкий проект, чтобы на голом энтузиазме что-нибудь стоящее сделать.я уж не говорю о конкуренции. |
Цитата:
|
Цитата:
чем ваш поисковик будет отличатся от остальных? почему кому-то будет более интересно пользоваться именно вашим поисковиком? рынок поисковиков, ИМХО вполне достаточно заполнен. Цитата:
если вы хотите просто научится чему-то новому, и вас не смущает необходимость каждый месяц платить из своего кармана за выделенный сервер, то тогда все ок. если же вы хотите сделать серьезный проект, которым бы пользовалось достаточно большое количество людей, и зарабатывать на этом, то вам придется в это дело вложить немало денег. в частности на рекламу. и в таком случае рекомендую снять розовые очки,и трезво глянуть на ситуацию |
Я всегда с удовольствием учусь чему-то новому и я готов тратить на это деньги, если они конечно есть :)
|
Gozar, положа руку на сердце: Вы будете пользоватся своим поисковиком? Я точно не буду :) Есть гугл, в качестве поискового средства он меня совершенно устраивает, и переходить на что-то иное... а зачем? Существуют всяческие meta.ua, search.qip.ru, ну и что? Кто ими пользуется?
|
Цитата:
Меня интересует как мой вопрос можно решить. Я хочу в нём разобраться. |
Цитата:
|
Цитата:
|
Цитата:
Цитата:
во всяком случае, это будет наиболее полезно естественно, что весь рунет для вас будет неподъемной ношей |
Часовой пояс GMT +3, время: 12:33. |