27 сентября 2019
|
|
Styx
Ну, можешь рассказать мне, как правильно парсить невалидный хтмл:) Как это делают бедные люди, типа меня? Берётся BeautifulSoup. Он нормально парсит большинство невалидного кода. Всё. У меня пока такого не было, чтоб он не смог. Вот раньше, когда я ещё изучал пхп (это было лет 10 назад), без регулярок ни один парсер не обходился. И зря, кстати, такой гон на регекспы. Во-первых, оно давно умеет в нерегулярные языки, во-вторых существуют регекспы здорового человека:) //Я, конечно, издеваюсь. На самом деле я за монадические парсеры. Но вообще, по теме есть кому чего добавить? 1 |