January 2026

S M T W T F S
     123
45678910
11121314151617
18192021222324
25262728293031

Style Credit

Expand Cut Tags

No cut tags
Friday, February 14th, 2020 10:19 am
Ten predictions for 2030

Довольно мрачные предсказания, но не вижу ничего, что бы я сказал "нет, такого не может быть!".
Saturday, February 15th, 2020 03:40 pm (UTC)
Не ведут.
Мультитредный код писать хорошо так и не научились.
Скорость доступа в память постоянно падает.
На этом фоне надо бы переделать все алгоритмы и абстракции, но никто не осиливает.
Отсюда все очень плохо и лучше не будет.
Да. Те самые ссд и память адово заторможены из-за старых абстракций блок девайсов.
Вообще состояние производительности в 2020 году - тотальная эмуляция.
CPU эмулирует х86 давно им не являясь. Мемори конроллер - память 80ых с ее быстрым доступом (через 3 а скоро и 4 уровня кэша). Диск: вообще целый компьтер в компьютере эмулирующий гребаные сектора и блоки. И т.д.
Везде извлекаются единицы процентов реально возможного.
Monday, February 17th, 2020 12:19 am (UTC)
Не ну контейнеры как абстракция: наконец-то нормальный процесс, а не хуйня протекающая, еще не самое плохое.
Но с другой стороны просто пойти и написать базу данных на современных технологиях уже никто не осиливает. Причем часто потому, что просто понимания нет. Когда в 2012 никто не понимает "зачем вам надо что-то кроме VM??" а в 2014 уже из любого утюга: докер, докер, докер. Начинают закрадываться сомнения, что хорошо быть умным...
Tuesday, February 18th, 2020 10:23 am (UTC)
Написать базу никто не осиливает не потому, что писать стало сложнее, а потому, что еще одно говно класса мускуля уже никого не интересует, а сделать хотя бы аврору уже нужны люди хорошо понимающие, что они делают.
Tuesday, February 18th, 2020 05:21 pm (UTC)
> сделать хотя бы аврору

Амазоновскую?
Да там тупая репликация под капотом. Говорю как краевед.
Вообще все решения Амазона простые и тупые до невозможности.
Тем и хороши, кстати. Ну и тем, что омозон практически никогда не убивает свои продукты.

> еще одно говно класса мускуля

Дело не совсем в этом, просто на самом деле производительность никому не нужна.
Все отлично знают насколько говном был и является хадуп, но оно стоит просто везде. Зачем стоит, и нахера покупали настолько никто не знает, что есть компании специализирующиеся на: а давайте мы вам что-то хоть как-то полезное на хадупе запустим.
Tuesday, February 18th, 2020 05:42 pm (UTC)
Под капот авроре не смотрел, но смотрел на производительность. До приличной коммерческой базы не дотягивает, но мускулю до нее уже как до луны. Меня это не удивляет, я поработал с нескольким людьми ее пилившими и не сомневаюсь в их профессиональных качествах.

Хадуп - это горизонтальная масштабируемость. Да, тупое, зато можно поднять кластер на десять тысяч нод и чего-нибудь быстро выпотрошить.
Tuesday, February 18th, 2020 06:16 pm (UTC)
> До приличной коммерческой базы не дотягивает

Там Postgres внутрях. Что такое "приличная коммерческая" хотелось бы узнать?

> Да, тупое, зато можно поднять кластер на десять тысяч нод и чего-нибудь быстро выпотрошить.

Нельзя. Вертикальная масштабируемость современного железа побеждает горизонтальную хадупа.
На 10000 нодов придется бороться с отказами нодов прямо во время квири, что нехило влияет на скорость, т.е. быстро не получится.
И я про то, что оказалось 99.9% купивших хадуп не знают зачем он им.
Tuesday, February 18th, 2020 07:14 pm (UTC)
Вообще-то в авроре и постгрес и мускуль (сюрприз, мускуль там тоже есть и он был раньше постгресса) изрядно модифицированные, что положительно сказывается на их производительности.

Приличная коммерческая, это например такая, которая почти линейно масштабируется до 16-socket NUMA, по 60 тредов на горшок.
Но я желаю всем иметь кошелек, которым можно такое покупать. Там одна железка пару миллионов стоит, а из нее по хорошему HA кластер собирать надо. Это, кстати, еще и о вертикальном масштабировании. Во-первых, страшно дорого, во-вторых, дальше особенно уже некуда.
Tuesday, February 18th, 2020 09:21 pm (UTC)
> изрядно модифицированные, что положительно сказывается на их производительности

чето не заметил.
но ессно модифицированные, как они тогда к ним не блок сторадж присоединили бы

> Приличная коммерческая, это например такая, которая почти линейно масштабируется до 16-socket NUMA, по 60 тредов на горшок

Неясно зачем это надо только.
В смысле, что I/O там все равно основной боттлнек, и если для его обслуживания надо 100 тредов - что-то тут не так.
Я уж не говорю что оно все бежит поверх OS у которой немного получше и с тредами и с менеджментом I/O.
Поэтому нормальная современная база данных - это append log поверх mmap. И тогда никакого бреда с кучей ЦПУ не надо.

> Во-первых, страшно дорого, во-вторых, дальше особенно уже некуда.

Это все в пользу бедных.
Гугл и Фейсбук не юзают "коммерческие базы данных" не потому, что у них денег нет, а потому, что их стоимость данных per-row никак не оправдывает такие дикие марджины вендоров.

Ну и по поводу MySQL Aurora: вот держи опен сорс от ютуба, на котором весь ютуб и работает
https://github.com/vitessio/vitess
Думаю по количеству траффика можно вообще ни с кем не сравнивать - у ютуба все равно длиннее и толще )
Tuesday, February 18th, 2020 10:14 pm (UTC)
В общем да.
Но если сильно хочется горизонтального скейлинга. Берешь cockroachdb. Сторед процедур нет. В остальном почти постгрес.
На самом деле как только нужно странного а не: возьми комп побольше. Начинаются спец решения в любом случае.
Wednesday, February 19th, 2020 08:36 am (UTC)
Ну тут кокроч поможет я думаю.
Они шардят по гибридному клоку.
Что тупо и прямо. Но очень неплохо работает.
В современном постгресе с тейбл-спейсами и роу-левел полиси вроде тоже не так мучительно шардится. Но я не специалист по постгрес шардингу. Может какие-то случаи неоче.
Wednesday, February 19th, 2020 10:48 pm (UTC)
Еси кассандра так мила, можно упороться https://github.com/rankactive/cassandra-fdw
Thursday, February 20th, 2020 09:52 am (UTC)
Ну так а чем плохо?
Сильно лучше, чем Yugabyte не сделать.
Разве что стордж сам не супер быстрый RocksDB все таки так себе.
Надо было lmdb брать. Да и квири не компилируются, а интерпретируются. Но тут вообще мало кто осиливает. В импале смогли, но дизайн агрегатов пролюбили.
Wednesday, February 19th, 2020 12:50 am (UTC)
Действительно, никому не надо, клиенты платят конские деньги за железо и лицензии просто так, прикола ради.

Ботлнеков много разных и базы делятся на те, что умеют их разруливать и те, что не умеют.

Также и ОС понятия не имеет о том, как эффективно управлять ресурсами базы и если дать ОС этим заниматься, она все нахрен высвопит, разложит процессы по неправильным нодам, я уж не говорю про оптимизацию для кэша, будет кидать процессы между конвеерами, просрет коммиты, и т.д. В общем бездарно пролюбит как минимум половину производительности.

"Гугл и Фейсбук не юзают "коммерческие базы данных" не потому, что у них денег нет"
При чем здесь деньги? RDBMS тупо не масштабируется до их объемов. Сами же приводите ссылку на мидлварь, которая базу использует тупо как KVS. Таки да, это, в общем, единственный способ не обидно использовать мускуль.
Wednesday, February 19th, 2020 01:28 am (UTC)
Ну почему прикола ради. Просто деньги есть. Мозгов нет. Почему бы не заплатить?

В общем случае никакое разруливание не поможет.

Это все конечно смешная теория. Но на практике имеем дибо старье про медленные диски либо новые к/в сторы но без транзакций.
Ну и конечно от rule of thumb: на написание рдбмс невозможно потратить меньше 10 лет, особо тоже никуда не делись.

Я вообще страшное скажу, как только в апликации нужно настоящее анду/реду, коллаборативность и дюрабилити - аппликация сама по себе становится рдбмс. И к сожалению даже сократить путь используя базу под низом нетривиально.
Отсюда к/в стор вполне очевидный фундамент.
Wednesday, February 19th, 2020 04:46 am (UTC)
Значит заработать кучу денег у них мозгов достаточно, а правильно их потратить может только анонимус, который почему-то столько заработать не в состоянии. Годный наброс, только в ту ли сторону повернут вентилятор?..

А про теорию действительно смешно, особенно если учесть, что пишете вы это человеку, у которого TPC с разными буковками были в рабочих обязанностях /отряхивает седые яйца/
Wednesday, February 19th, 2020 08:31 am (UTC)
"Мозги" в данном случае ессно: ИТ департмент.
Если бизнес не в IT то им мозги действительно не нужны для зарабатывания денег.

Да. Это. Медалями трясти не надо. У меня своих есть нормально так.