Страница 1 из 1
Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-21 19:25:10
.scu
Видел ли кто-нибудь информацию по исследованиям на тему, какой объем данных (строки\столбцы) оптимален на таблицу?
Вопрос интересует для того, чтобы сформировать правильное деление данных на таблицы, для осуществления быстрой выборки по ним.
Предмет вопроса:
база сайтов ~ 500 тысяч.
База страниц сайтов ~ 10 млн.
Возможно у кого-то есть данные на основе собственного опыта?
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-21 20:45:18
Bayerische
На сколько я разбираюсь в колбасных обрезках, MySQL всё равно, на сколько таблиц бьётся весь объём данных, и на сколько полей бьётся таблица. В итоге, всё упирается в быстродействие сервера.
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-21 21:56:33
.scu
как тогда объяснить, что выборка из таблицы меньшего объема делается в разы быстрее, чем выборка из таблицы большого объема?
сервер один и тот же.
Ну и по логике обращение к более короткой таблице (файлу) и выборка из нее будет выполняться быстрее, чем к длинной.
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-21 22:13:08
Bayerische
По логике, с дроблением базы увеличивается количество таблиц. В чём преимущество, непонятно.
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-21 23:01:11
FiL
от запросов очень зависит. Таки работа с маленькими таблицами быстрее работы с большими. С другой стороны, джойны сильно замедляют работу по сравнению с одной таблицей. Так что просто так бить таблицы на куски только ради уменьшения каждой таблицы смысла не имеет.
Если таблицы таки очень большие, то имеет смысла подумать о table partitioning. Но опять-же, надо смотреть какие запросы идут к таблице и как будет правильнее разбивать ее на разделы.
Ну а "правило буравчика" для таблиц примерно такое - если таблица не лезет целиком в память, то имеет смысл подумать над ее делением.
Не всегда нужно будет делить, но подумать в этом направлении стоит.
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-22 9:17:09
Gamerman
Иногда более критично, как индексы построены. Таблица может быть большая, но если индексы красыво сделаны, то пофиг ее размер, главное чтоб индексы быстро обработались.
Re: Оптимальная разбивка больших объемов данных на табли
Добавлено: 2011-07-22 20:07:28
FiL
ну, я исхожу из условия, что с индексами всё уже хорошо и лучше быть не может
