Javascript-форум (https://javascript.ru/forum/)
-   Общие вопросы Javascript (https://javascript.ru/forum/misc/)
-   -   Написал генератор тегов не могу найти ошибку (https://javascript.ru/forum/misc/43904-napisal-generator-tegov-ne-mogu-najjti-oshibku.html)

MrBoriska 25.12.2013 23:21

Написал генератор тегов не могу найти ошибку
 
В общем для своего сайта нужно написать генератор тегов на чистом яваскрипте или с использованием ajax.. но я выбрал js. Написал, и вроде даже работало, до тех пор пока не прикрутил слова-исключения, с тех пор код не работает, хотя ошибку не выдает. В js я недавно. И мог упустить что то важное, тем более большая часть кода спионерена(уже не помню где)

Собственно форма такая
<textarea id="editor" class="text-area" name="mainText">some text</textarea><!-- так же может подключатся редактор и для записи текста будет использоваться форма с классом .wysibb-text-editor(без дублирования в #editor)-->
<input id="keywords" type="text" name="tags" value="сюда генератор выводит теги через запятую" />
<input type="button" value="Get keywords!" onclick="countKeywords()">
<input type="text" value="4" id="minLengthKeyword">
<input type="text" value="3" id="minRepeatKeyword">
<input type="text" value="0.8" id="coincidence">
<input type="text" value="тут слова исключения, если они есть" id="noRepeatKeyword">


И сама логика

var keywords1, keywords2 = new Array(), keywords3 =  new Array();
function getWords(s) {	
	return s.replace(/[^а-яА-Яa-zA-Z]+/g, " ").toLowerCase(); // Возвращаем массив только из букв
}
function getKeywords(s) {
	var tmp;
	tmp = getWords(s);
	return tmp.split(" "); // Возвращаем массив тегов
}
function countKeywords () {
	var s = $('#editor').attr("value") + $('.wysibb-text-editor').html(); // Получаем текст из которого нужно выделить теги
	
	var noRepeatKeyword = $('#noRepeatKeyword').attr("value"), // Получаем слова-исключания
         re = /\s*,\s*/, // убираем пробелы вокруг запятых
         NoTags = noRepeatKeyword.split(re);// Выделяем массив слов-исключений 


	var minLengthKeyword = parseInt(document.getElementById('minLengthKeyword').value), // Минимальная длинна тега
	     minRepeatKeyword = parseInt(document.getElementById('minRepeatKeyword').value), // Минимальное количество его повторений
	     coincidence = parseFloat(document.getElementById('coincidence').value); // Коэффицент совпадения
	
	var tmpKeywords1 = getKeywords(s),
	     tmpKeywords2 = new Array();

	for (i=0;i<tmpKeywords1.length;i++) { // Перебираем полученный массив и создаем новый из удовледворяющих условию элементов
		var currentWord = tmpKeywords1[i],
        DeleteWord = false,
		n=0;

		while ((n<NoTags.length) && (DeleteWord = true)) {
		if (currentWord = NoTags[n]) {DeleteWord = true;} // если элемент из тегов совпадает с одним из исключаений назначаем флаг
		n= n+1;
		}
		
		if ((currentWord.length >= minLengthKeyword) && (DeleteWord = false))  {
			keywords2.push(currentWord); // Добавляем в массив результатов если length >= minLengthKeyword и если это слово не входит в исключения
		}
	}


	for (i=0;i<keywords2.length;i++) { // Перебираем полученный массив и создаем новый из удовледворяющих условию элементов
		var currentWord = keywords2[i];
		currentWordCore = currentWord.substr(0,Math.round(currentWord.length*coincidence));
		
		var inwords2 = keywords2.grep(currentWordCore);

		if (inwords2.length >= minRepeatKeyword && keywords3.grep(currentWordCore).length <1) { 
			keywords3.push(currentWord);
		}
	}	
	document.getElementById('keywords').value = keywords3;
	keywords2 = new Array();
	keywords3 = new Array();
}

// Создаем и выводим строку тегов
function grep(str) { 
	var ar = new Array();
	var arSub = 0;
	for (var i in this) {
		if (typeof this[i] == "string" && this[i].indexOf(str) != -1){
			ar[arSub] = this[i];
			arSub++;
		}
	}
	return ar;
}
Array.prototype.remove=function(s){
  for(i=0;i<this .length;i++){
    if(s==this[i]) this.splice(i, 1);
  }
}

Array.prototype.grep = grep;

danik.js 25.12.2013 23:28

Цитата:

Сообщение от MrBoriska
В общем для своего сайта нужно написать генератор тегов на яваскрипте или с использованием ajax.. но я выбрал js

Научишь использовать ajax без js?:dance:

рони 25.12.2013 23:33

MrBoriska,
где элементы из 11 строки? и в jquery есть .val()

MrBoriska 25.12.2013 23:34

Цитата:

Сообщение от danik.js (Сообщение 289286)
Научишь использовать ajax без js?:dance:

Нелепо придираться к словам, там было пропущено слово "чистом". Я имею ввиду, что без отправки данных в php и взятия их от туда с помощью js, да.

MrBoriska 25.12.2013 23:38

Цитата:

Сообщение от рони (Сообщение 289288)
MrBoriska,
где элементы из 11 строки? и в jquery есть .val()

извиняюсь, забыл прикрепить в html еще и форму с текстом, ну там понятно что она есть)).
Ошибка где то ниже, с проверкой на то, что элемент массива равен какому-нибудь элементу из массива слов исключений.

Спасибо за .val(), я еще не знаю всех функций.

finestra 26.12.2013 14:31

в строке 30 - (DeleteWord = true) - всегда возвращает труэ
и в строке 35 - (DeleteWord = false) - всегда фалсэ
обычно так не делают :nono:
условие в строке 35 никогда не выполнится

рони 26.12.2013 14:37

Цитата:

Сообщение от finestra
условие в строке 35 никогда не выполнится

почему?

finestra 26.12.2013 14:52

Цитата:

Сообщение от MrBoriska (Сообщение 289283)
if ((currentWord.length >= minLengthKeyword) && (DeleteWord = false)) {

может имелось в виду if ((currentWord.length >= minLengthKeyword) && (DeleteWord === false)) {

рони 26.12.2013 15:19

finestra,
ок

MrBoriska 26.12.2013 17:21

Спасибо за найденные ошибки) Я еще не очень вник в типы данных, поэтому не знал что проверки нужно делать на тождественности.

Вот исправленный код, который начал выводить теги, как и раньше. Но цикл while, который должен сравнить элемент текущей итерации цикла for со всеми элементами массива NoTags[] и при любом совпадении устанавливать флаг DeleteWord = true что завершает цикл while... походу не работает.

var keywords1, keywords2 = new Array(), keywords3 =  new Array();
function getWords(s) {	
	return s.replace(/[^а-яА-Яa-zA-Z]+/g, " ").toLowerCase(); // Возвращаем массив только из букв
}
function getKeywords(s) {
	var tmp;
	tmp = getWords(s);
	return tmp.split(" "); // Возвращаем массив тегов
}
function countKeywords () {
	var s = $('#editor').val() + $('.wysibb-text-editor').html(); // Получаем текст из которого нужно выделить теги
	
	var noRepeatKeyword = $('#noRepeatKeyword').val(), // Получаем слова-исключания
         re = /\s*,\s*/, // убираем пробелы вокруг запятых
         NoTags = noRepeatKeyword.split(re);// Выделяем массив слов-исключений


	var minLengthKeyword = parseInt($('#minLengthKeyword').val()), // Минимальная длинна тега
	     minRepeatKeyword = parseInt($('#minRepeatKeyword').val()), // Минимальное количество его повторений
	     coincidence = parseFloat($('#coincidence').val()); // Коэффицент совпадения
	
	var tmpKeywords1 = getKeywords(s),
	     tmpKeywords2 = new Array();

	for (i=0;i<tmpKeywords1.length;i++) { // Перебираем полученный массив и создаем новый из удовледворяющих условию элементов
		var currentWord = tmpKeywords1[i],
        DeleteWord = false,
		n=0;

		while ((n<NoTags.length) && (DeleteWord === true)) {
		  if (currentWord = NoTags[n]) {
		     DeleteWord = true;
		  } // если элемент из тегов совпадает с одним из исключаений назначаем флаг
		  n=n+1;
		}
		
		if ((currentWord.length >= minLengthKeyword) && (DeleteWord === false))  {
			keywords2.push(currentWord); // Добавляем в массив результатов если length >= minLengthKeyword и если это слово не входит в исключения
		}
	}


	for (i=0;i<keywords2.length;i++) { // Перебираем полученный массив и создаем новый из удовледворяющих условию элементов
		var currentWord = keywords2[i];
		currentWordCore = currentWord.substr(0,Math.round(currentWord.length*coincidence));
		
		var inwords2 = keywords2.grep(currentWordCore);

		if (inwords2.length >= minRepeatKeyword && keywords3.grep(currentWordCore).length <1) { 
			keywords3.push(currentWord);
		}
	}	
	document.getElementById('keywords').value = keywords3;
	keywords2 = new Array();
	keywords3 = new Array();
}

// Создаем и выводим строку тегов
function grep(str) { 
	var ar = new Array();
	var arSub = 0;
	for (var i in this) {
		if (typeof this[i] == "string" && this[i].indexOf(str) != -1){
			ar[arSub] = this[i];
			arSub++;
		}
	}
	return ar;
}
Array.prototype.remove=function(s){
  for(i=0;i<this .length;i++){
    if(s==this[i]) this.splice(i, 1);
  }
}

Array.prototype.grep = grep;

рони 26.12.2013 17:45

MrBoriska,
может для примера что на входе что на выходе должно быть?

MrBoriska 26.12.2013 22:02

обычная строка(берете любой пост хоть от сюда и подставляете). Как сейчас мы пишем посты вот такого типа и у меня. Код просто должен генерировать слова которые повторяются в тексте, а число повторений и коэффициент указывает юзер,

а так же он указывает через запятую слова, которые генератор не должен учитывать, но у меня, именно вот этот пункт почему то не работает.
Может там где функция grep(), что то не то, а то я не понимаю вообще зачем она, точнее понимаю зачем, но не понимаю как она так это делает(там подписано что).

рони 26.12.2013 22:26

MrBoriska,
ваш код разбирать видимо охотников мало, легче написать новый еслибы вы чётко описали свой генератор ... что на входе что на выходе я попрежнему незнаю несмотря на ваши обьяснения

MrBoriska 26.12.2013 23:51

На выходе должна быть строка, состоящая из слов перечисленных через запятую.
На входе должно быть три переменные:
1. Строка, состоящая из набора слов, символов, пробелов и даже html тегов.
2. Число, которое означает минимальное количество символов в слове.
3. Число, означающее минимальное количество повторений слова в тексте.
4. Слова, перечисленные через запятую, которые не следует учитывать при выводе результата.

Программа должна работать примерно по такому алгоритму.
1. Из переменной 1 выкидываются спец. символы и html теги, остается только сам текст и пробелы между словами. Из полученного текста формируется массив, элементы которого - это слова, отделенные друг от друга пробелом в тексте.
2. В массиве ищутся совпадающие элементы и из этих элементов, количество совпадений которых больше или равно переменной 3 формируется новый массив.(заметье с учетом введенного в переменной 4 коэффициента совпадения)
3. Из полученного массива выкидываются элементы, количество букв которых меньше чем указано в переменной 2, а так же элементы которые указаны в переменной 4 через запятую.
4. Из полученного массива формируем строку, в которой элементы этого массива будут перечислены через запятую.

Так понятно? Да и вроде код мой тоже относительно понятный, кроме двух последних функций.

finestra 26.12.2013 23:59

мне конечно тоже лень, разбираться что как работает,
но вот в строке 27, вы присваиваете DeleteWord = false,
в while (строка 30), в условии написано, что оно может выполниться
если DeleteWord === true, но обрести значение труэ DeleteWord
может только внутри цикла,
выходит, что цикл никогда не запустится.

finestra 27.12.2013 00:19

функция countKeywords () большая,
раздели ее на несколько функций поменьше,
и каждую протестируй.

рони 27.12.2013 00:54

MrBoriska,
function gen(str, len, repeat,tabu)
   { var obj_tabu = {};
     for (var i=0; i<tabu.length; i++)  {obj_tabu[tabu[i]]=!0};//сформировали обьект из запретных слов
     str = str.replace(/<[^>]*>/g, ' ');//выкусили теги
     str = str.replace(/[^a-zа-яё\s]/gi, ' '); //убрали небуквы
     str = str.split(/\s+/) ;//сформировали массив слов из строки
     var obj_output = {};
     for (var i=0; i<str.length; i++)  {
       var word = str[i];
       if(word.length >= len && !obj_tabu[word])  obj_output[word]=(obj_output[word]||0)+1;
     } // сформировали обьект из разрешённых слов  и нужной длины
     var output = [];
     for(var word in obj_output) if (obj_output[word] >= repeat) output.push(word);//отобрали слова с нужным повторением
     return output
   }
  var str = 'На выходе должна быть строка, состоящая из слов перечисленных через запятую..'+
'На входе должно быть три переменные: '+
'1. Строка, состоящая из набора слов, символов, пробелов и даже html тегов. '+
'2. Число, которое означает минимальное количество символов в слове. '+
'3. Число, означающее минимальное количество повторений слова в тексте. '+
'4. Слова, перечисленные через запятую, которые не следует учитывать при выводе результата.'
  alert(gen(str, 3, 2,['Число','слов']) )

MrBoriska 27.12.2013 00:54

finestra,
я уже все протестировал и сразу сказал где код стопорится!

Меня это тоже смутило, но даже если изменить на false результат тот же.

MrBoriska 27.12.2013 00:56

рони,
Огромное спасибо! Буду тестировать и отпишусь о результатах.

MrBoriska 27.12.2013 18:06

Код работает великолепно, но нету коэффициента совпадения.
Тоесть это еще один параметр, который определяет когда словам совпадать, а когда нет. Определяется он числом с плавающей точкой, От 0 и до 1, где 0 это когда все слова всегда будут совпадать, а когда 1 то только при точном совпадении. Ну допустим при 1 будут равны keyword и keyword, а при 0.8 будут равны keyword и keywords. сделать можно через match(),(так было сделано в старом коде)

finestra 28.12.2013 23:46

как насчет этого
var coefficient = function(word1, word2) {
	word1 = word1.toLowerCase();
	word2 = word2.toLowerCase();
	var r = new RegExp(word1);
	
	if(r.test(word2)) {
		return  Math.round((word1.length / word2.length)*10)/10;
	} else {
		return 0;
	}
};
var coeff1 = coefficient("keyword", "keywords"), // 0.9
    coeff2 = coefficient("keyFord", "keywords"); // 0


coeff2 должен быть 0?

MrBoriska 30.12.2013 21:46

Желательно доработать тот код, т.к. я уже из того плагин сделал и куча всего на него завязал.

Тоесть код вот такой теперь.

function gen(str,tabu,len,repeat,tags,tabuhide) { 
     var str, // Получаем текст из которого нужно выделить теги
          tabu = tabuhide + tabu.val(), // Получаем слова-исключения
          len = parseInt(len.val()), // Минимальная длинна тега
	      repeat = parseInt(repeat.val()), // Минимальное количество его повторений
	      tags, output = '';

     var  tabu = tabu.split(/\s*,\s*/), obj_tabu = {};
     for (var i=0; i<tabu.length; i++)  {obj_tabu[tabu[i]]=!0}; //сформировали обьект из запретных слов
     str = str.replace(/<[^>]*>/g, ' '); //выкусили теги
     str = str.replace(/[^a-zа-яё\s]/gi, ' '); //убрали небуквы
     str = str.split(/\s+/); //сформировали массив слов из строки
	 
     var obj_output = {};
     for (var i=0; i<str.length; i++)  {
       var word = str[i];
       if(word.length >= len && !obj_tabu[word])  obj_output[word]=(obj_output[word]||0)+1; // сформировали обьект из разрешённых слов и нужной длины
	 } 
	 
     var output1 = [];
     for(var word in obj_output) if (obj_output[word] >= repeat) output1.push(word); //отобрали слова с нужным повторением 
	 for (var i=0; i<output1.length; i++) if (i<1) output += output1[i]; else output += ', ' + output1[i]; // создали строку из элементов массива через запятую
	 
     return tags.val(output);
}



В общем нужно добавить в функцию еще один аргумент, не трогая положения старых, с коэффициентом совпадения и завязать сам процесс поиска совпадений еще и на нем. Более ничего не надо. Я бы и сам сделал, но в обьектах не шарю вообще.

MrBoriska 30.12.2013 21:48

правда строку из массива лучше создать join'ом) но это не суть. :)

рони 31.12.2013 15:23

MrBoriska,
пока из вашего описания коффициента совпадения я понял что слова так, атака, тактика и стакан это 1 слово и оно повторилось 4 раза ... предлагаю решать подобные задачи методом job

MrBoriska 31.12.2013 16:03

Ладно, в любом случае, я свою задачу уже решил, а коэффициент вещь не очень то и нужная.

С наступающим! И всем спасибо!


Часовой пояс GMT +3, время: 00:02.