Парсинг чата
Подскажите, пожалуйста, что можно использовать для парсинга сообщений чата (нужен чат стримов с сайта goodgame.ru). Поиск по гуглу ничего не дает, а я очень плохо знаю js, и не представляю, на каких технологиях основаны подобные чаты.
Как осуществляется подобный парсинг? |
Парсинг сообщений чата? Это как? Что ты с ними делать собираешься?
|
Erolast
Хочу сделать русский аналог системы коллективной игры Twitch Plays Pokémon. Суть - человек вбивает команды в чат, и они передаются эмулятору. На Twitch чат - это IRC канал, я сделал простейший IRC-клиент на питоне, выхватывал сообщения и передавал их в эмулятор. Сейчас хочу переделать систему на русский канал (например, указанный мною goodgame), но там нету irc канала для чата, и я незнаю, как извлечь оттуда команды. |
Так а эмулятор где? Как к нему команды передаются? Насколько я понял в том чате просто аяксом данные в DOM подгружаются. Можно просто в браузере на страницу чата внедрить скриптик который будет по таймеру смотреть в html страницы и вытаскивать подгруженные сообщения. Вопрос в том, куда это потом всё надо передать?
|
jsnb
Сообщения обрабатываются программой на python'е, и передаются в эмулятор с помощью winAPI. Соответственно, цель - передавать скриптом сообщения в эту питоновскую программу, или напрямую подключаться из питона и считывать сообщения. Второй вариант даже лучше. Цитата:
|
python умеет делать http запросы. Задача сводится к элементарному парсингу текса. Скорее всего даже можно напрямую получать чистые новые сообщения, если разобраться во внутреннем устройстве чата.
Ссылочку только конкретно на чат дайте, чтоб можно было посмотреть. |
Цитата:
|
Aetae
Напрямую из python без посредника на javascript было бы замечательно. Допустим, вот этот чат (вот от этого канала) |
Там используется websocket. К python оный прикрутить можно, но хз как там с открытостью, сессиями итд. В общем мне лень копать.)
|
Цитата:
|
Часовой пояс GMT +3, время: 08:47. |