Причина неподдержки кириллицы в js-коде
Привет. Имеется большой сложный словарный скрипт, который делался для работы с латиницей — но при попытке добавить поддержку кириллицы, он не отрабатывает. То есть, когда по умолчанию юзер кликает на слово, набранное латиницей - задействуется приведенная ссылка, из которой апострофы и пробелы заменяются на URI-код:
Код:
<a href='?page=definition&word="+n.replace(/'/g,"%27").replace(/ /g,"%20")+"'>"+n+"</a> Код:
.replace(/а/g,"%430").replace(/о/g,"%43E") |
Используй на клиенте encodeURIComponent. На сервере соответствующий decode_uri для языка. Не надо делать своих нестандартных костылей.
|
То есть, если таким образом заменять буквы — работать не будет, потому что нужен encodeURIComponent? Сам не смогу его добавить и потестировать, потому спрашиваю.
|
Может и будет. Всё заисит от кодировки сервера, кодировки js-файла и кодировки html файла. Самые разные сочетания могут породить самые разные варианты кодирования символов и самые разные глюки.
В современном вебе везде используется utf8. Но в utf8 символ "а" кодируется как "%D0%B0", а не как "%430". encodeURIComponent обеспечивает стандартное кодирование безотносительно, но смысл имеет только если сервер раскодирует также по стандарту. |
А имеет значение, если это не сервер, а код приложения? То есть, это в приложении так реализовано, что через ссылку происходит переход к слову. Там тоже utf8, и замена с "%430" на "%D0%B0" изменений не дала.
|
Интересно, что если перед кириллицей стоит один символ латиницы (например: "fслово") — то переход срабатывает.
|
hdma,
Попробуй так: <a href='?page=definition&word="+encodeURIComponent(n).replace(/'/g,"%27")+"'>"+n+"</a> |
Спасибо, теперь начал видеть кириллицу в начале списка, но по-прежнему не переходит. Кажется дело в том, что ниже есть другая строка, в которой символы кодируются в обратную сторону:
{a=a.replace(/%20/g," ").replace(/%430/g,"а").replace(/%43E/g,"о").replace(/%27/g,"'"), Вообще говоря, речь о коде из этого приложения, с редким функционалом перехода по любым словам в тексте и поиска с подстановочными знаками, которые позволяют искать слова, правописание которых неизвестно. Там словарь на 200 тысяч слов очень экономно сделан. Если взглянете, тут по ссылке APK-файл, который можно открыть через любой архиватор — https://disk.yandex.ru/d/amhXyapjX_WA4Q, ну или установить на телефон. |
decodeURIComponent чтоб раскодировать.)
|
А как правильно записать это в строке? Так? —
{a=a.decodeURIComponent(n).replace(/%20/g," ").replace(/%27/g,"'"), |
Что-то не идёт. Может потому что как-то надо кириллическую букву А (вместо английской A) правильно прописать для алфавита? —
case"A":return void a.e(5).then(a.bind(null,16)).then((function(i){var a=i.definitions_A |
Ну это для теста. В файле "app.js" я прописал кириллицей две буквы "аа" в самом начале списка слов. то же самое добавил в файле "3.js" в начале списка:
{"аа":0, То есть, воспроизвел всё то же самое, как это работало для латиницы. Соответственно, мне кажется, если с первой буквой сработает, то и остальные пойдут. А так же, если перед этой кириллицей и тут — case"A":return — поставить англ. букву А, то переход по клику начинает работать. |
Цитата:
|
Rise, вот спасибо, уважаемый! Буду пробовать
|
Rise, если позволите, возникли вопросы. Я хотел бы сразу наладить возможность перехода к определению для первого слова с кириллицей, прописанного в базе — а дальше уже логику понял. Поэтому поначалу пытаюсь поменять только то, что запустит работу переходов по перечню слов. Для этого в самое начало базы добавил две буквы "а" кириллицей:
var N=["аа", (И соответственно, в файл "3.js" добавил var a={"аа":0,) И то же самое в №№ 3 и 4 (наши буквы "А", вместо английских): //3 F={A:0,B:23288,C:45163,D:77117 ... //4 W="ABCDEFGHIJKLMNOPQRSTUVWXYZ0", //7 case"А":return void a.e(5).then(a.bind(null ... //8 e.prototype.normalizeLetter=function(e){var i=e[0].toUpperCase();return i>="А"&&i<="Z"?i:"0"}, Во все регулярки во всём файле "app.js", в которых встречались "a-z" — добавил соответствующие регистрам диапазоны с кириллицей, А-Яа-яЁё — /^[А-Яа-яЁёa-zA-Z0-9 '-]*$/ /[\.\d]|[А-ЯЁA-Z]|-$|^-/ Для "\W" — который означает "не-буква" — затрудняюсь найти соответствующую замену. Правильно ли понимаю, что в js при использовании шаблона \W — кириллица не опознаётся как буква, и именно поэтому ее следует изменить? И это же касается \W во второй строке, где есть экранирование? — /\W/g new RegExp("(\\W)"+i+"[\\.):]","ig"); В остальном — №1, №9, №10 — поменял и выяснилось, что переходить по первому слову с уже сделанными изменениями, не получается. Хотелось бы именно задействовать работу первого слова в базе, а в остальном я понял логику. |
Цитата:
//3 F={A:0,B:23288,C:45163,D:77117 ... //4 W="ABCDEFGHIJKLMNOPQRSTUVWXYZ0", //7 case"А":return void a.e(5).then(a.bind(null ... //8 e.prototype.normalizeLetter=function(e){var i=e[0].toUpperCase();return i>="А"&&i<="Z"?i:"0"}, Просто хотелось бы запустить переход по клику с минимумом изменений, так как если всё править - наверняка можно ошибиться и тогда сложнее будет понять, где был недочёт. И затрудняюсь понять как прописывать экранированную \W. Попробовал по такому же принципу экранировать [^A-Za-z0-9_], — но тоже не пошло: s=new RegExp("(\\W)"+i+" заменил на: s=new RegExp("(\[\^A-Za-z0-9_\])"+i+" |
Кстати, должны ли файлы «app.js» и «3.js» быть в UTF-8, или они по умолчанию в ANSI могут быть?
|
Rise, зафурычило, спасибище!
Мне бы хотелось ещё один момент попробовать решить с вашей помощью — в отношении сохранения ударений в словах, которые бы при наборе не мешали поиску. Наверняка вы знаете такой символ ударения, который когда ставишь перед буквой — она делается ударной: Акце́нт Вот тут пример поиска как бы сквозь это ударение — то есть, при наборе букв ударение не мешает поиску. Возможно ли то же самое осуществить в разбираемом здесь коде — например, удалив этот символ ударения именно для поиска, но чтобы он оставался видимым на экране? |
Круто, спасибо! Только не удаётся правильно вписать строку с прокси. Пробовал вот так сразу после массива, а также ниже вписывать, через запятые и через точку запятой —
"-ways","-yl"],N = new Proxy(N,{get(o,p){return(o.hasOwnProperty(p)&&p!=' length')?o[p].replace('\u0301',''):o[p]}});console.log(N[0], N[1], N[2], N.length),F={А:0,Б:23288, |
Rise,
Точно, консоль лишняя) Попробовал, но акцент не отображается — похоже, что replace('\u0301','') везде его затирает. |
Вот так записал:
,"-ways","-yl"],N = new Proxy(N,{get(o,p){return(o.hasOwnProperty(p)&&p!=' length')?o[p].replace('\u0301',''):o[p]}}),F={А:0,Б:23288,C:45163, |
Rise, я позже насчет этого обращусь, спасибо большое. Возник такой вопрос: возможно ли в этом приложении включить работу тегов, чтобы в файлах с определениями ими можно было обрамлять элементы и они соответственно отображались? Хотя бы курсив?
|
Да, мне бы хотелось возможности обрамлять текст тегами, как минимум курсив и жирность. То есть, чтобы можно было обернуть какой-либо текст из файла с определениями в теги, либо другими условными знаками, и он бы отображался в HTML формате. Например, прописывать так
Код:
{305315} <i>{300056} {203886}</i> of the {007980} Код:
{305315} <<{300056} {203886}>> of the {007980} if(a.endsWith("..."))z=a;else{z="",e=function(e,i,a){for(var s=/{(\d\d\d\d\d\d)}/g,r=i.split("\n"),n="",o=e+": ",t=0;t<r.length;t++){var l=r[t].split("|");if(!(l.length<4)){var c=l[0];n+="<b class='theme-accent-colour'>(<i>"+c+".</i>)</b> ",o+="("+c+".) ";var u=l[1];u.length>0&&(n+="["+u+"] ");for(var d=3;d<l.length;d++)l.length>4&&(n+="<b class='theme-accent-colour'>"+(d-2).toString()+".</b> ",o+=" "+(d-2).toString()+". "),n+=l[d]+" ",o+=l[d]+" ";var p=l[2];p.length>0&&(n+=" <span class='etym'>["+p+"]</span>"),n+="<br /><br />"}}return[n=n.replace(s,(function(i,s){var r=parseInt(s),n=a.getWord(r);return n===e?n:"<a href='?page=definition&word="+encodeURIComponent(n).replace(/ /g,"%20").replace(/'/g,"%27")+"'>"+n+"</a>"})), |
hdma,
Там же есть CSS, можно поменять, слова то и так в тегах. |
Rise,
Точно, спасибо. Они прямо в определениях поддерживаются. Видимо, в прошлый раз неправильно тестировал |
Часовой пояс GMT +3, время: 01:12. |