Соглашения о наименованиях

5. Соглашения о наименованиях

5.1 Синтаксические и лексические грамматики

Этот раздел описывает контекстно-свободные грамматики, использованные в этой спецификации для определения лексической и синтаксической структуры программы на ECMAScript.

5.1.1 Контекстно-свободные грамматики

Контекстно-свободная грамматика состоит из набора правил. Каждое правило состоит из абстрактного символа, называемого нетерминалом, в качестве левой части и последовательности из нуля или более нетерминальных или терминальных символов в качестве правой части. Для каждой грамматики терминальные символы берутся из указанного алфавита.

Начиная с предложения, состоящего из одиночного специального нетерминала, называемого начальным символом, данная контекстно-свободная грамматика описывает язык, а именно, набор (возможно, бесконечный) допустимых последовательностей терминальных символов, которые могут быть порождены в результате рекурсивной замены любого нетерминала в последовательности на правую сторону правила, для которого этот терминал является левой стороной.

5.1.2 Лексическая и РегВыр грамматики

Лексическая грамматика для ECMAScript приведена в разделе 7. Терминальными в этой грамматике являются символы Юникода. Она содержит набор правил, начинающийся с начального символа ВходнойЭлементДеления или ВходнойЭлементРегВыр, определяющий способ преобразования последовательности символов Юникода в последовательность входных элементов.

Входные элементы, отличные от пробелов и комментариев, образуют терминалы синтаксической грамматики ECMAScript и называются токенами ECMAScript. К токенам относятся ключевые слова, идентификаторы, литералы и знаки пунктуации языка ECMAScript. Более того, символы окончания строк, хотя и не считаются токенами, тоже становятся частью потока входных элементов и руководят процессом автоматической подстановки точек с запятой (7.9). Простые пробелы и однострочные комментарии игнорируются и не появляются в потоке входных элементов для синтаксической грамматики. МногострочныйКомментарий (то есть комментарий вида "/* --- */", вне зависимости от того, занимает ли он в действительности одну или несколько строк) аналогичным образом игнорируется, если в нём не содержится переводов строк; однако если МногострочныйКомментарий содержит один или более символов окончания строки, то он заменяется на единственный перевод строки, который становится частью потока входных элементов синтаксической грамматики.

РегВыр-грамматика для ECMAScript приведена в разделе 15.10. Символы Юникода являются терминальными также и в этой грамматике. Она содержит набор правил, начинающийся с начального символа Шаблон, определяющий способ преобразования последовательностей символов Юникода в шаблоны регулярных выражений.

Правила лексических и РегВыр-грамматик описываются с использованием двойного двоеточия ("::") в качестве разделительного знака. Некоторые правила являются общими для лексических и РегВыр-грамматик.

5.1.3 Численная строковая грамматика

Следующая грамматика используется для перевода строк в числовые значения. Она является аналогичной той части лексической грамматики, которая описывает численные литералы, и её терминалами являются символы Юникода. Эта грамматика описывается в разделе 9.3.1.

Правила численной строковой грамматики описываются с использованием тройного двоеточия (":::") в качестве разделительного знака.

5.1.4 Синтаксическая грамматика

Синтаксическая грамматика для ECMAScript приведена в разделах 11, 12, 13 и 14. В этой грамматике терминалами являются токены ECMAScript, определенные в лексической грамматике (5.1.2). Она содержит набор правил, начинающийся с начального символа Программа, определяющий способ преобразования последовательностей токенов в синтаксически корректные программы на ECMAScript.

Когда поток символов Юникода распознается в качестве программы на ECMAScript, он предварительно преобразуется в поток входных элементов путём рекурсивного применения правил лексической грамматики. Затем этот поток входных элементов распознаётся путём однократного применения синтаксической грамматики. Программа считается синтаксически неверной, если токены потока входных элементов не могут быть распознаны как единичный экземпляр начального нетерминала Программа без оставшихся избыточных токенов.

Правила численной строковой грамматики описываются с использованием одиночного двоеточия (":") в качестве разделительного знака. Синтаксическая грамматика, описанная в разделах 0, 0, 0 и 0 (прим. ред. - это в англ. версии стандарта опечатка), на самом деле не является исчерпывающим определением того, какие последовательности токенов принимаются в качестве корректных программ на ECMAScript. Приемлемыми являются также некоторые дополнительные последовательности токенов, а именно те, которые описывались бы грамматикой, если бы символы "точка с запятой" были добавлены в последовательность в некоторых местах (например перед символами перевода строк). Кроме того, некоторые последовательности токенов считаются неприемлемыми, если символ окончания строки встречается в определённых "неудобных" местах.

5.1.5 Нотация грамматики

Терминальные символы лексической и строковой грамматик и некоторые из терминальных символов синтаксической грамматики обозначаются шрифтом постоянной ширины как в правилах грамматики, так и всюду в тексте спецификации, где текст явно ссылается на этот терминальный символ. Эти символы должны появляться в программе точно в таком же виде. Все нетерминальные символы, обозначенные таким образом, следует понимать как соответствующие символы Юникода из ASCII-диапазона, а не аналогично выглядящие символы из других диапазонов.

Нетерминальные символы обозначаются курсивом. Определение нетерминала начинается с имени нетерминала, за которым следует одно или более двоеточий. (По числу двоеточий можно определить, к какой грамматике относится правило.) За ними, на последующих строках, приводится одна или несколько альтервстроенных правых сторон нетерминала. Например, синтаксическое определение:

ИнструкцияWith :: with ( Выражение ) Инструкция

гласит, что нетерминал ИнструкцияWith представляет токен with, за которым следует токен "левая скобка", Выражение и токен "правая скобка", за которыми, в свою очередь, идет Инструкция. Здесь элементы Выражение и Инструкция сами по себе являются нетерминалами. В качестве другого примера приведём синтаксическое определение:

СписокАргументов :: ВыражениеПрисваивания; СписокАргументов , ВыражениеПрисваивания

которое гласит, что СписокАргументов может представлять либо отдельное ВыражениеПрисваивания, либо последовательность из СпискаАргументов, запятой и ВыраженияПрисваивания. Это определение СпискаАргументов является рекурсивным, то есть в своем определении ссылается на само себя. В результате СписокАргументов может содержать любое положительное число аргументов, разделённых запятыми, где выражением для каждого аргумента является ВыражениеПрисваивания. Подобные рекурсивные определения нетерминалов весьма часто используются в описаниях формальных грамматик.

Набранный нижним индексом суффикс "опц", который может быть указан после терминала или нетерминала, указывает на необязательный (опциональный) символ. Вариант, содержащий опциональный символ, в действительности описывает две правые части: не включающую опциональный символ и включающую его. Это означает, что:

ОбъявлениеПеременной :: Идентификатор Инициализатор_опц

является сокращённым для удобства вариантом полной записи:

ОбъявлениеПеременной :: Идентификатор
Идентификатор Инициализатор

и что:

ИнструкцияИтератор :: for ( ВыражениеБезIn_опц ; Выражение_опц ; Выражение_опц ) Инструкция

является сокращённым для удобства вариантом полной записи:

ИнструкцияИтератор :: for (; Выражение_опц ; Выражение_опц ) Инструкция; for ( ВыражениеБезIn ; Выражение_опц ; Выражение_опц ) Инструкция

которая, в свою очередь, является сокращением для:

ИнструкцияИтератор :: for (;; Выражение_опц ) Инструкция; for (; Выражение ; Выражение_опц ) Инструкция; for ( ВыражениеБезIn ;; Выражение_opt ) Инструкция; for ( ВыражениеБезIn ; Выражение ; Выражение_опц ) Инструкция

которая, в свою очередь, является сокращением для:

ИнструкцияИтератор :: for (;;) Инструкция; for (;; Выражение ) Инструкция; for (; Выражение ;) Инструкция; for (; Выражение ; Выражение ) Инструкция; for ( ВыражениеБезIn ;;) Инструкция; for ( ВыражениеБезIn ;; Выражение ) Инструкция; for ( ВыражениеБезIn ; Выражение ;) Инструкция; for ( ВыражениеБезIn ; Выражение ; Выражение ) Инструкция

Таким образом, нетерминал ИнструкцияИтератор на самом деле имеет восемь вариантов правых частей.

Если в качестве правой части правила указывается обозначение "[пусто]" - это значит, что правая часть правила не содержит терминалов или нетерминалов.

Если в правой стороне правила встречается обозначение "[предпросмотр ∉ множество]" - это значит, что правило не может быть использовано, если непосредственно за терминалом следует один из элементов указанного множества. Множество может быть описано как список терминалов, заключённый в фигурные скобки. Для простоты множество также может описываться нетерминалом. В этом случае, оно представляет собой множество всех терминалов, в которые может быть развернут указанный нетерминал. Например, если уже имеются определения

ДесятичнаяЦифра :: одна из: 0 1 2 3 4 5 6 7 8 9

ДесятичныеЦифры ::: ДесятичнаяЦифра
ДесятичныеЦифры ДесятичнаяЦифра

то определение

ПримерПредпросмотра ::: n [предпросмотр ∉ {1, 3, 5, 7, 9}] ДесятичныеЦифры; ДесятичнаяЦифра [предпросмотр ∉ ДесятичнаяЦифра ]

описывает либо букву n, за которой следует одна или более десятичных цифр, первая из которых чётная, либо десятичная цифра, за которой не следует другая десятичная цифра.

Если обозначение "[здесь нет КонцаСтроки]" появляется в правой части правила синтаксической грамматики, оно обозначает, что данное правило является ограниченным правилом, т.е. не может быть использовано, если КонецСтроки встречается в данном месте входного потока. Например, правило:

ВыражениеReturn :: return [здесь нет КонцаСтроки] Выражение_опц ;

означает, что данное правило не может быть использовано, если КонецСтроки встречается в программе между токеном return и Выражением.

За исключением тех случаев, когда появление КонцаСтроки явно запрещается ограниченным правилом, КонецСтроки может появляться любое количество раз между двумя соседними токенами потока входных элементов, не нарушая корректности текста программы.

Когда слова "один из" следуют за двоеточием(-ями) в определении грамматического правила, они обозначают, что каждый из терминальных символов на последующей строке или строках представляет собой вариант правой части. К примеру, лексическая грамматика ECMAScript содержит следующее определение:

НенулеваяЦифра :: одна из: 1 2 3 4 5 6 7 8 9

которое просто является удобной сокращённой записью для:

НенулеваяЦифра: 1 2 3 4 5 6 7 8 9

Когда в качестве одного из вариантов в правиле лексической или численно-строковой грамматики приводится токен, состоящий из нескольких символов, он обозначает последовательность символов, которые бы составили вместе такой токен.

В определении правой части правила также может уточняться, что некоторые её трактовки не являются допустимыми. На это указывают слова "но не", за которыми приводятся трактовки, подлежащие исключению. Например, правило:

Идентификатор ::: ИмяИдентификатора но не КлючевоеСлово

означает, что нетерминал Идентификатор может быть заменён любой последовательностью символов, которая может заменить ИмяИдентификатора, кроме тех последовательностей, которые также могут заменить КлючевоеСлово.

Наконец, в тех случаях, когда явно приводить все возможные варианты было бы нецелесообразно, для некоторых нетерминальных символов приводится словесное описание в обычном шрифте (Roman):

ИсходныйСимвол ::: любой символ Юникода

5.2 Соглашения по алгоритмам

В данной спецификации часто приводятся нумерованные списки, обозначающие шаги алгоритма. Эти алгоритмы используются для прояснения семантики языка. В действительности, для реализации той или иной функциональности могут использоваться более эффективные алгоритмы.

Когда алгоритм должен вернуть некоторое значение в качестве результата, директива "вернуть x" означает, что результатом алгоритма является значение x и что алгоритм должен остановиться в данной точке. Обозначение Результат(n) используется как сокращение для "результат шага n". Тип(x) используется как сокращение для "тип x".

Математические операции, такие как сложение, вычитание, отрицание, умножение, деление и математические функции, определенные ниже в данном разделе всегда должны пониматься как вычисление точного математического результата в математических вещественных числах, которые не включают бесконечностей и отрицательного нуля, отличающегося от положительного нуля. Алгоритмы данного стандарта, моделирующие работу арифметики с плавающей запятой, при необходимости явно включают в себя шаги по произведению округлений и обработке бесконечностей и знакового нуля. Если математическая операция или функция применяется к числу с плавающей запятой, её следует понимать как применённую к точному математическому значению, представленному этим числом. Такое число с плавающей запятой должно быть конечным, и если оно равняется +0 или -0, то соответствующее математическое значение принимается просто за 0.

Математическая функция abs(x) возвращает модуль x, который равен -x, если x отрицателен (меньше нуля), и равен просто x в противном случае.

Математическая функция sign(x) возвращает 1 для положительного x и -1 для отрицательного x. Функция sign не применяется в данном стандарте для случаев, когда x равен нулю.

Обозначение "x modulo y" (где y должно быть конечным и не равным нулю) вычисляет значение k такого же знака, как и y (или ноль), такое, что abs(k)< abs(y) и x-k = q * y для некоторого целого q.

Математическая функция floor(x) возвращает наибольшее целое (ближайшее к плюс бесконечности), которое не превосходит x.

ЗАМЕЧАНИЕ
floor(x) = x-(x modulo 1).

Если алгоритм по определению должен в данной точке "бросить исключение", выполнение алгоритма прекращается, и никакого результата не возвращается. Выполнение иерархии вызвавших его алгоритмов тоже последовательно прекращается, до тех пор пока не будет достигнут уровень алгоритма, который явно обрабатывает исключение, используя терминологию наподобие "если было брошено исключение...". Как только уровень такого алгоритма был достигнут, исключение более не считается случившимся.

Автор: Гость (не зарегистрирован), дата: 9 октября, 2008 - 20:23

#permalink

п. 5.1.4, третий абзац:
Правила численной строковой грамматики описываются с использованием одиночного двоеточия (":") в качестве разделительного знака. Синтаксическая грамматика, описанная в разделах 0, 0, 0 и 0, на самом деле...

Сюда, кажется, закралась пара ошибок.

перейдите на форум для обсуждения и вопросов

Автор: Илья Кантор, дата: 10 октября, 2008 - 14:12

#permalink

Да нет, там ошибок нет. Это перевод стандарта.

В самом ECMA-стандарте опечатка. Я не поправил ее только по той причине, что они сами не исправляют.

перейдите на форум для обсуждения и вопросов

Автор: Иваннн, дата: 25 ноября, 2011 - 14:48

#permalink

п.5.1.1-2. Пытаюсь догнать что имели в виду авторы. Складывается впечатление, что понять суть написанного пожно только уже зная эту суть. нет ли где пояснений, знаете как коментарии к законам, хотя бы по двум этим пунктам. Я к сожелению не доконца понимаю смысл слова "литерал", а темболее теримнальный и не терминальный. Да может каждый школьник это знает, а я, хоть убейте, не могу понять. Надеюсь на ответ

перейдите на форум для обсуждения и вопросов

Автор: MitrickX, дата: 6 января, 2012 - 14:15

#permalink

Надо понимать, хотя бы в общих, что такое формальные языки, формальные грамматики, контекстно-свободные грамматики, лексический анализ и т.д. Можно почитать в википедии, например.

перейдите на форум для обсуждения и вопросов

Автор: Launder, дата: 1 августа, 2020 - 15:06

#permalink

Аналогично. Читал на английском, слишком много абстракций, дай, думаю, посмотрю перевод, может хоть лучше понятно будет, о чём. Ну не знаю, либо качество перевода такое, когда просто переводится практически дословно и бездумно, либо что-то ещё, но я совершенно согласен с тем, что понять тут что-то с нуля, (мне) не представляется возможным. Возможно, когда уже знаешь, может помочь что-то уточнить. И да, наверное, всё-таки лучше на английском читать, со словарём, может даже лучше получится контекст уловить.
Нужны какие-то примеры, чтоб можно было к чему-то эти абстракции приложить.

перейдите на форум для обсуждения и вопросов

Текущий раздел

Поиск по сайту

Содержание

Учебник javascript

Основные элементы языка

Сундучок с инструментами

Интерфейсы

Все об AJAX

Оптимизация

Разное

Дерево всех статей

Последние темы на форуме

Forum

Форум

Справочник

Discord чат

Курсы javascript

Соглашения о наименованиях

Учебник javascript

Основные элементы языка

Сундучок с инструментами

Интерфейсы

Все об AJAX

Оптимизация

Разное