stas | учиться, учиться, учиться

You're viewing

stas's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

February 2026

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Navigation

Page Summary

stas - (no subject)

Style Credit

Style: Blue for Drifting by Jennie Griner
Resources: OSWD design

Expand Cut Tags

No cut tags

учиться, учиться, учиться

stas

Sunday, March 18th, 2012 01:15 pm

Записался на два онлайновых курса - Cryptography и NLP. Посмотрим, вытяну ли оба.

Обнаружил, что лекции мне гораздо удобнее слушать на ускорении 1.25x, а некоторые - даже на 1.50x. Правда, лекторы звучат так, как будто они принимают амфетамины, но зато отвлекаюсь меньше. А то в оригинале они уж больно рассудительно диктуют.

Tags:

Flat | Top-Level Comments Only

no subject

stas

Monday, March 19th, 2012 01:42 am (UTC)

Я первую (спамлорда) только что сдал, хотя её, конечно, можно ещё долго полировать, но их примеры простенькие, так что я не стал сильно углубляться. Больше всего времени потратил на то, чтобы он не думал, что фраза "code at runtime. It" это не итальянский мейл :)

Парсер жабаскрипта кстати просто написать - достаточно заматчить {script ..}somefunc('blah.com', 'myname'){/script} я думаю.

Я на самом деле ещё забацал парсер, который разбирает вот такое: http://www.albionresearch.com/misc/obfuscator.php плюс String.fromCharCode() но дальше стало лень.

Edited 2012-03-19 01:44 am (UTC)

no subject

oxfv.livejournal.com

Monday, March 19th, 2012 02:01 am (UTC)

С жабаскриптом надо парсить текст как одну строку, или держать стейт для многострочных функций. И по-хорошему надо выполнять жабаскрипт в песочнице, потому что если одна функция вызывает три других, руками это отслеживать быстро устанешь. И вот когда мне в качестве домашней работы предлагают, фактически, писать эмулятор джаваскрипта, я сдуваюсь :)

На самом деле, искать емейлы регэкспами - это как лезть вверх по канату на руках. Если мускулы есть, то до потолка спортзала долезешь. Но потом-то окажется, что еще сто этажей впереди. Тогда надо аккуратно слезть и ~~идти вызывать лифт~~ расчехлять machine learning.

no subject

stas

Monday, March 19th, 2012 02:41 am (UTC)

Я первым делом выкинул построчный парсинг и сделал всё in memory. Если нам предлагают веб-странички как модель, то они в память лезут хорошо, нечего мудрить. Поэтому я делаю так:
1. декодировать все html entities
2. заменить весь whitespace на пробелы
по хорошему, надо бы ещё вычистить HTML - но я поленился. Может ещё допишу.

И по-хорошему надо выполнять жабаскрипт в песочнице, потому что если одна функция вызывает три других, руками это отслеживать быстро устанешь.

Ну, зачем в крайности вдаваться :) Я сделал 2 правила:
1. функции вида blah('something.com', 'something') или blah('somehing', 'something.com') - это мейл something@something.com
2. код вида document.write('a'+'b'+'c') это document.write('abc')
плюс декодировать url encoding и html entities, а дальше регекспами добивать :)
Конечно, оно далеко не все случаи покрывает, но не писать же жабаскриптный VM в самом деле :)

А вообще это такая штука, что можно частные случаи добавлять бесконечно...

Flat | Top-Level Comments Only

Frodo

Peddling unsubstantiated hope

February 2026

Navigation

Page Summary

Style Credit

Expand Cut Tags

учиться, учиться, учиться

no subject

no subject

no subject