Записался на два онлайновых курса - Cryptography и NLP. Посмотрим, вытяну ли оба.
Обнаружил, что лекции мне гораздо удобнее слушать на ускорении 1.25x, а некоторые - даже на 1.50x. Правда, лекторы звучат так, как будто они принимают амфетамины, но зато отвлекаюсь меньше. А то в оригинале они уж больно рассудительно диктуют.
Обнаружил, что лекции мне гораздо удобнее слушать на ускорении 1.25x, а некоторые - даже на 1.50x. Правда, лекторы звучат так, как будто они принимают амфетамины, но зато отвлекаюсь меньше. А то в оригинале они уж больно рассудительно диктуют.
Tags:
no subject
Парсер жабаскрипта кстати просто написать - достаточно заматчить {script ..}somefunc('blah.com', 'myname'){/script} я думаю.
Я на самом деле ещё забацал парсер, который разбирает вот такое: http://www.albionresearch.com/misc/obfuscator.php плюс String.fromCharCode() но дальше стало лень.
no subject
На самом деле, искать емейлы регэкспами - это как лезть вверх по канату на руках. Если мускулы есть, то до потолка спортзала долезешь. Но потом-то окажется, что еще сто этажей впереди. Тогда надо аккуратно слезть и
идти вызывать лифтрасчехлять machine learning.no subject
1. декодировать все html entities
2. заменить весь whitespace на пробелы
по хорошему, надо бы ещё вычистить HTML - но я поленился. Может ещё допишу.
И по-хорошему надо выполнять жабаскрипт в песочнице, потому что если одна функция вызывает три других, руками это отслеживать быстро устанешь.
Ну, зачем в крайности вдаваться :) Я сделал 2 правила:
1. функции вида blah('something.com', 'something') или blah('somehing', 'something.com') - это мейл something@something.com
2. код вида document.write('a'+'b'+'c') это document.write('abc')
плюс декодировать url encoding и html entities, а дальше регекспами добивать :)
Конечно, оно далеко не все случаи покрывает, но не писать же жабаскриптный VM в самом деле :)
А вообще это такая штука, что можно частные случаи добавлять бесконечно...