LADYX,
Ну хз, насколько это проще реализовать без плагина.
Я так понимаю, что сначала "ловим" тот момент, когда картинка появляется в окне браузера, потом определяем нужную точку в окне браузера (до которой анимация должна завершиться) , потом прописываем анимацию, которая срабатывает от точки появления на экране до определённой выше точки в браузере.
Вот, например, как можно определить тот момент, когда наш элемент попал в нужную область видимости (появился в окне браузера).
Смотреть тут