Javascript-форум (https://javascript.ru/forum/)
-   Общие вопросы Javascript (https://javascript.ru/forum/misc/)
-   -   Парсинг чата (https://javascript.ru/forum/misc/46229-parsing-chata.html)

aHuxley 02.04.2014 17:23

Парсинг чата
 
Подскажите, пожалуйста, что можно использовать для парсинга сообщений чата (нужен чат стримов с сайта goodgame.ru). Поиск по гуглу ничего не дает, а я очень плохо знаю js, и не представляю, на каких технологиях основаны подобные чаты.
Как осуществляется подобный парсинг?

Erolast 02.04.2014 17:34

Парсинг сообщений чата? Это как? Что ты с ними делать собираешься?

aHuxley 02.04.2014 17:48

Erolast
Хочу сделать русский аналог системы коллективной игры Twitch Plays Pokémon. Суть - человек вбивает команды в чат, и они передаются эмулятору.

На Twitch чат - это IRC канал, я сделал простейший IRC-клиент на питоне, выхватывал сообщения и передавал их в эмулятор.

Сейчас хочу переделать систему на русский канал (например, указанный мною goodgame), но там нету irc канала для чата, и я незнаю, как извлечь оттуда команды.

jsnb 02.04.2014 18:19

Так а эмулятор где? Как к нему команды передаются? Насколько я понял в том чате просто аяксом данные в DOM подгружаются. Можно просто в браузере на страницу чата внедрить скриптик который будет по таймеру смотреть в html страницы и вытаскивать подгруженные сообщения. Вопрос в том, куда это потом всё надо передать?

aHuxley 02.04.2014 18:47

jsnb
Сообщения обрабатываются программой на python'е, и передаются в эмулятор с помощью winAPI.
Соответственно, цель - передавать скриптом сообщения в эту питоновскую программу, или напрямую подключаться из питона и считывать сообщения. Второй вариант даже лучше.

Цитата:

Сообщение от jsnb (Сообщение 305666)
внедрить скриптик который будет по таймеру смотреть в html страницы и вытаскивать подгруженные сообщения.

Т.е. скачать страницу чата, дописать туда скрипт, и запускать её прямо с компа, я правильно понимаю? Есть какой нибудь пример реализации подобного?

Aetae 02.04.2014 18:56

python умеет делать http запросы. Задача сводится к элементарному парсингу текса. Скорее всего даже можно напрямую получать чистые новые сообщения, если разобраться во внутреннем устройстве чата.

Ссылочку только конкретно на чат дайте, чтоб можно было посмотреть.

jsnb 02.04.2014 19:34

Цитата:

Сообщение от aHuxley (Сообщение 305674)
jsnb
Т.е. скачать страницу чата, дописать туда скрипт, и запускать её прямо с компа, я правильно понимаю? Есть какой нибудь пример реализации подобного?

Ну, можно попробовать и так. Правда всё равно надо думать как потом это в питоновый скрипт передавать т.к. JS внутри браузера ограничен своей песочницей и во вне доступа не имеет. Можно конечно нагородить костыльный завод... Думаю Aetae в этом намного лучше меня разбирается, поэтому слушайте его. :)

aHuxley 02.04.2014 19:49

Aetae
Напрямую из python без посредника на javascript было бы замечательно.
Допустим, вот этот чат (вот от этого канала)

Aetae 02.04.2014 20:54

Там используется websocket. К python оный прикрутить можно, но хз как там с открытостью, сессиями итд. В общем мне лень копать.)

aHuxley 02.04.2014 21:02

Цитата:

Сообщение от Aetae (Сообщение 305699)
Там используется websocket

Теперь хотя бы знаю, в какую сторону копать))


Часовой пояс GMT +3, время: 23:47.