| 
	| 
	
	| 
		
	| 
			
			 
			
				15.11.2014, 23:30
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| 
				перевод таблицы в массив
			 Есть html-код таблицы, находящийся в переменной var htm - таблица динамическая, и кол-во строк - может меняться (от 0 - таблица пустая до бесконечности =) впрочем, более 20 строк не ожидается) 
нужно спарсить эту таблицу, и получить данные в виде массива
 
// куча пробелов оставлена специально ибо в таком виде таблица попадает в переменную
var htm='<tbody style="outline: 1px solid blue;">            <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>          </tbody>';
alert(htm.replace(/\s+/gim,' ').match(/<td.*?>(.*?)<\/td>/g));
 
единственное, чего, пока что, удалось мне добиться - это удаления лишних тегов и впечатления, что я иду не тем путем =) 
Просьба помочь разобраться, как спарсить не <td>any text</td>... а только "any text" и при этом раскидать его по массиву, в котором каждая ячейка массива - это ячейка из таблицы
 
текущий результат работы скрипта:
 
	
 
	| Код: |  
	| 	0: <td class="complKnowlege" style="vertical-align:middle;text-align:center"> 1 </td>
	1: <td class="complKnowlege" style="vertical-align:middle;"> АБС "ЭНИКЕЙЩИКИ И КО" </td>
	2: <td style="vertical-align:middle;"> ЮЛ </td>
	3: <td style="vertical-align:middle;"> 032600003909 </td>
	4: <td style="vertical-align:middle;"> 000240014809 </td>
	5: <td style="vertical-align:middle;"> 11.02.2000 </td>
	6: <td style="vertical-align:middle;"> </td>
	7: <td class="complKnowlege" style="vertical-align:middle;"> </td>
	8: <td class="complKnowlege" style="vertical-align:middle;"> Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span> </td> |  
	
			 Последний раз редактировалось Cache, 15.11.2014 в 23:59.
				Причина: правка рег.выражения
 |  |  
	| 
		
	| 
			
			 
			
				15.11.2014, 23:57
			
			
			
		 |  
	| 
		
			|  | Тлен       |  | 
					Регистрация: 02.01.2010 
						Сообщений: 6,601
					 
		
 |  |  
	| Для начала: никогда не использовать регулярные выражения для разбора html. 
Делать следует примерно так:
 
var htm='<tbody style="outline: 1px solid blue;">            <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>             <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>          </tbody>';
parse = (function(){
   var div = document.createElement('div'), 
       text = 'textContent' in div ? 'textContent' : 'innerText',
       map = Array.prototype.map;
   return function parse(htm){
      div.innerHTML = '<table>' + htm + '</table>';
      return map.call( div.firstChild.rows, function(row){
         return map.call( row.cells, function(cell){
            return cell[text].trim();
         })
      })
   }
}());
alert(JSON.stringify( 
   parse(htm)
, null, '\t'))
Для поддержки старых браузеров потребуются полифилы для Array.prototype.map и String.prototype.trim.
				__________________ 29375, 35
			 Последний раз редактировалось Aetae, 16.11.2014 в 00:01.
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:00
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| Aetae, проблема в том, что нельзя использовать document. и JSON.они просто не поддерживаются приложением
 			 Последний раз редактировалось Cache, 16.11.2014 в 00:03.
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:01
			
			
			
		 |  
	| 
		
			
			| Профессор     |  | 
					Регистрация: 09.11.2014 
						Сообщений: 610
					 
		
 |  |  
	| 
<html>
<head>
<meta charset="windows-1251" />
</head>
<body>
<script>
var htm='<tbody style="outline: 1px solid blue;">            <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>          </tbody>';
s=htm.replace(/<[^>]+>/g, "")
s=s.replace(/\s+/g, " ")
alert(s.split(" "))
console.log(s.split(" "))
</script>
</body>
</html>
			 Последний раз редактировалось krutoy, 16.11.2014 в 00:05.
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:12
			
			
			
		 |  
	| 
		
			|  | Тлен       |  | 
					Регистрация: 02.01.2010 
						Сообщений: 6,601
					 
		
 |  |  
	| Cache, а откуда приходит эта таблица? Может там на месте сразу её и обрабатывать, а в "приложение" пускай приходит уже чистенький массив?
 P.S. Если нет JSON значит древняя версия js, скорее всего на винде. Если на винде установлен современный ie, то вроде как-то можно включить в скрипте современный движок. Это конечно зависит то того что это за "приложение" такое.
 
				__________________ 29375, 35
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:13
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| Ваш результат: 
	
 
	| Код: |  
	| ,1,АБС,"ЭНИКЕЙЩИКИ,И,КО",ЮЛ,032600003909,000240014809,11.02.2000,Дата,:05.06.2009,Тип,:Признан,недействительным, |  
	
 
в нем каждое слово - элемент массива, а мне не каждое слово нужно, а текст из каждого блока <td> |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:14
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| 
	
 
	| Сообщение от Aetae   |  
	| Если нет JSON значит древняя версия js, скорее всего на винде. Если на винде установлен современный ie, то вроде как-то можно включить в скрипте современный движок. Это конечно зависит то того что это за "приложение" такое. |  
	
 не знаю как, но они выпилены из приложения: ReferenceError: document is not defined 
	
 
	| Сообщение от Aetae   |  
	| Cache, а откуда приходит эта таблица? Может там на месте сразу её и обрабатывать, а в "приложение" пускай приходит уже чистенький массив? |  
	
 из веб-страницы			 Последний раз редактировалось Cache, 16.11.2014 в 00:34.
				Причина: грамматика, будь она не ладна))
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:22
			
			
			
		 |  
	| 
		
			
			| Профессор     |  | 
					Регистрация: 09.11.2014 
						Сообщений: 610
					 
		
 |  |  
	| Cache, Вот это уже ближе? 
  
<html>
<head>
<meta charset="windows-1251" />
</head>
<body>
<script>
var htm='<tbody style="outline: 1px solid blue;">            <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>          </tbody>';
//console.log(htm.replace(/\s+/gim,' ').match(/<td(.*?)>\s*<\/td>/gim));
s=htm.replace(/<[^>]+>/g, "|||")
s=s.replace(/\s+/g, " ")
arr=s.split("|||")
newArr=[]
for(i in arr){
if(/^\s*$/.test(arr[i])) continue; newArr.push(arr[i])
}
alert(newArr)
console.log(newArr)
</script>
</body>
</html>
Щас, еслине засну, допилю может быть  
			
			
	
			
			
			
			
			
				  |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:28
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| Aetae, 
исходя из вашего примера сделал следующее:
 
var htm='<tbody style="outline: 1px solid blue;">            <tr>        <td class="complKnowlege" style="vertical-align:middle;text-align:center">         1        </td>        <td class="complKnowlege" style="vertical-align:middle;">         АБС  "ЭНИКЕЙЩИКИ И КО"        </td>        <td style="vertical-align:middle;">         ЮЛ        </td>                 <td style="vertical-align:middle;">          032600003909         </td>                <td style="vertical-align:middle;">         000240014809        </td>        <td style="vertical-align:middle;">         11.02.2000        </td>        <td style="vertical-align:middle;">                 </td>        <td class="complKnowlege" style="vertical-align:middle;">                 </td>                 <td class="complKnowlege" style="vertical-align:middle;">         Дата :<span class="grayText">05.06.2009 </span> Тип :<span class="grayText">Признан недействительным </span>        </td>       </tr>          </tbody>';
htm=htm.match(/<td.*?>(.*?)<\/td>/g);
for(var key in htm){htm[key]=htm[key].replace(/<[^>]+>/g, '').trim().replace(/\s{2,}/gim,' ');};
alert(htm);
 			 Последний раз редактировалось Cache, 16.11.2014 в 00:47.
				Причина: небольшая оптимизация, призванная убрать лишние пробелы после удаления </span>
 |  |  
	| 
		
	| 
			
			 
			
				16.11.2014, 00:30
			
			
			
		 |  
	| 
		
			
			| Кандидат Javascript-наук       |  | 
					Регистрация: 02.05.2013 
						Сообщений: 111
					 
		
 |  |  
	| krutoy, ближе, но последнюю ячейку разбивает на несколько элементов из-за присутствия тега <span> и пропускает пустые ячейки, что не допустимо 			 Последний раз редактировалось Cache, 16.11.2014 в 00:32.
 |  |  |  |