файл отрицательного размера

Thursday, October 2nd, 2008 10:46 am (UTC)

update statistics?

no subject

Thursday, October 2nd, 2008 10:56 am (UTC)

не понял

no subject

Thursday, October 2nd, 2008 11:11 am (UTC)

все эти оптимизации работают при актуальной статистике.
я помню плохо, но что-то типа analyze table update statistics.

no subject

Thursday, October 2nd, 2008 11:31 am (UTC)

а без статистики оракл настолько туп, что не может использовать имеющийся индекс самостоятельно?

no subject

Thursday, October 2nd, 2008 11:33 am (UTC)

С неправильной статистикой он решил что без индекса или с другим индексом быстрее.

no subject

npocmu.livejournal.com

Thursday, October 2nd, 2008 11:35 am (UTC)

А откуда у него еще возьмутся сакральные знания о том, какой индекс предпочтительней? Только из статистики...

no subject

Thursday, October 2nd, 2008 12:11 pm (UTC)

проверяемое поле неиндексированное, это флажок. поэтому другого индекса нет. есть только тот, который пришлось добавить вручную.

no subject

Thursday, October 2nd, 2008 11:41 am (UTC)

Сложно использовать индекс без знания о его кардинальности и селективности.
Потому что можно влететь ещё больше, чем на фуллскане.

no subject

Thursday, October 2nd, 2008 12:09 pm (UTC)

больше, чем на фуллскане - это как?

no subject

Thursday, October 2nd, 2008 12:10 pm (UTC)

это выбрать по индексу 90% записей большой таблицы.

no subject

Thursday, October 2nd, 2008 12:18 pm (UTC)

спасибо, понял.

no subject

Thursday, October 2nd, 2008 12:12 pm (UTC)

полный перебор даже B-дерева - дольше, чем плоской структуры.

no subject

Thursday, October 2nd, 2008 12:08 pm (UTC)

Я ораклом не занимался много лет, но у него есть 2 оптимизатора afair - cost based и rule based. Вот поведение которое ты ждешь оно rule based - запрос такого типа выполняется по индексу и все.

Cost based принимает решение вида что "нафиг использовать индекс если мы например сейчас выберем 80% всей таблицы - быстрее full scan". Для этого естественно нужна статистика. Посколько ситуации в которых cost based рулит мне всегда казались очень странными я его всегда вырубал.

Если у тебя есть мнение про то как должны бы вполняться запросы переключи его в rule based (на вскидку не помню как это делается)

Edited 2008-10-02 12:09 pm (UTC)

no subject

Thursday, October 2nd, 2008 12:21 pm (UTC)

можно просто SELECT /*+rule*/

>Посколько ситуации в которых cost based рулит мне всегда казались очень странными я его всегда вырубал.
Это очень упрощенный подход к жизни, в общем оракл обещает rbo выкинуть и хинты тоже отменить, и это правильно.

no subject

Thursday, October 2nd, 2008 12:44 pm (UTC)

что мой подход упрощенный - согласен.

Но подход выкинуть rbo и хинты тоже упрощенный - все равно будут ситуации где человеку лучше знать как провести оптимизацию. Но как я уже говорил мой oracle остановился на версии 8i (который кстати я незнал-незнал и забыл) - возможно у них есть какая-то другая альтернатива для этого, про которую я просто не знаю.

Edited 2008-10-02 12:47 pm (UTC)

no subject

Thursday, October 2nd, 2008 12:48 pm (UTC)

единственный нужный хинт +first_rows человек действительно правильно знает что хочет первые строки, в остальных случаях сомнительно. В например DB2 нет хинтов и как-то живут, и я пять лет программировал под информикс, тоже хинтами не пользовался.

no subject

Thursday, October 2nd, 2008 12:57 pm (UTC)

Я скорее не про хинты, а про rule based. В смысле хинты это просто средство заставить оптимизатор "прекратить умничать и пальцем показать", а rule based это наиболее тупой вариант поведения который вообще не умничает. В Mysql-е хинты помоему даже есть, но я ни разу не пользовался т.к. там всегда понятно что mysql сделаетс запросом при заданных индексах.

no subject

Thursday, October 2nd, 2008 01:02 pm (UTC)

таблица t1 с индексом по f1 и таблица t2 с индексом по f1

select *
from t1,t2
where t1.f0=t2.f0 and t1.f1=0 and t2.f1<0

что сделает mysql ?

no subject

Friday, October 3rd, 2008 09:41 am (UTC)

mysql по-моему всегда тупо сделает join.

Сам пример хороший аргумент против концепции "ничего кроме rule based не "нужно

no subject

Friday, October 3rd, 2008 09:56 am (UTC)

проблема с какой таблицы начать, т.е. надо знать какой предикат отсечет больше записей и какой метод соединения выбрать hashj nl mergej sortj ?

mysql всегда сначала идет в первую (во from) таблицу или как?

no subject

Friday, October 3rd, 2008 01:19 pm (UTC)

Да как-то так. Это зависит естественно от того какие индексы созданы.

Я на самом деле понял, что если сделать индексы:
t1: f1, f0
t2: f1, f0
то этот запрос можно выполнить очень быстро проходом по 2 индексам сразу.

no subject

Thursday, October 2nd, 2008 01:14 pm (UTC)

я, собственно, потому вопрос и задал, что информикс без всяких хинтов нормально сам оптимизирует. и на этом фоне оракл меня удивил.

no subject

Thursday, October 2nd, 2008 01:27 pm (UTC)

оптимизатор информикса зажил на гистограммах в 96 году (самый дубовый вариант update statistics high -- собирает все по самое не могу, а в оракле немного сложнее), все базы оракла встречаемые мной сегодня до сих пор без гистограмм, статистику в них или не собирают или собирают неправильно.

Ну и еще оракл позволяет намного более изощеренные варианты и оптимизатор там намного намного сложнее.

вот например
http://www.sql.ru/forum/actualsearch.aspx?search=%CD%E5+%EF%EE%ED%FF%F2%ED%EE%2C+%E2%FB%E1%E8%F0%E0%E5%F2+%EF%EB%E0%ED+%F1+%E1%EE%EB%FC%F8%E5%E9+%F1%F2%EE%E8%EC%EE%F1%F2%FC%FE&sin=0&a=%C6%F3%F0%E0%E2%EB%E5%E2+%C4%E5%ED%E8%F1&ma=0&bid=3&dt=-1&s=1&so=1
оракл лажает на запросах, которые в принципе невозможны в информиксе.

с другой стороны
http://www.sql.ru/forum/actualthread.aspx?bid=3&tid=362323#3689350
оптимизатор оракла строит план очень долго, а информикс за 0.1 сек.

no subject

Thursday, October 2nd, 2008 12:53 pm (UTC)

хотя если по честному в оракле я частенько использую хинты или уловки (numrows>=0), что бы сделать план таким каким мне надо, например только что написал:

select *
from (select * from a where func1(a.f0)>0 and numrows>=0), b

но причина лишь в том что проектировщик слишком полагался на функции, а их стоимость современные субд оценить не могут.

no subject

Thursday, October 2nd, 2008 01:18 pm (UTC)

а что такое numrows? Мой оракл такого не знает.

тьфу rownum

Thursday, October 2nd, 2008 01:33 pm (UTC)

rownum

писал в этот момент в информиксе запрос к systables и переклинило.

для запроса с rownum оптимизатор не может сделать merge
т.е. переписать к виду:
select *
from a , b
where func1(a.f0)>0

Re: тьфу rownum

Thursday, October 2nd, 2008 01:38 pm (UTC)

ага, ясно, спасибо

Re: тьфу rownum

Thursday, October 2nd, 2008 01:46 pm (UTC)

Еще фокус в том что оптимизатор не может сделать predicate pushing

Т.е. функция тяжеловесна и ее надо выполнить последним предикатом

имеем запрос
select * from a where a.f1=100 and func1(a.f0)>0
какой предикат проверяется сначала, а фиг знает, а все функции по мнению оракла равен 0
есть хинт ordered_predicates но он неудобен, если предикатов >2

я переписываю запрос так numrows>=0
select *
from (select * from a where ... and numrows>=0)
where func1(a.f0)>0

Re: тьфу rownum

Thursday, October 2nd, 2008 02:25 pm (UTC)

тоже интересно. я так понимаю, оракл всеми силами хочет сказать, что тяжелые функции над полями использовать не надо

за 5 лет работы ора дба ни разу не использовал INDEX_JOIN

Thursday, October 2nd, 2008 11:59 am (UTC)

ой дебильный хинт.
видимо ваш разраб. не сделал индекса (поле,дата_добавления)

Re: за 5 лет работы ора дба ни разу не использовал INDEX_JOIN

Thursday, October 2nd, 2008 12:03 pm (UTC)

вариант объяснения почему дольше такой (считаем что статистика есть):

без хинта, оракл пошел в таблицу и делал полный скан и его стоимость была меньше, чем в сумме проход обоих индексов, но индексы лежали в кеше, и выполнилось быстрее.

короче покажи
set autotrace on
вариант с хинтом;
вариант без хинта;

и все станет абсолютно ясно.

Re: за 5 лет работы ора дба ни разу не использовал INDEX_JOIN

Thursday, October 2nd, 2008 12:08 pm (UTC)

ну да, индекса конкретно по этим двум полям нет, потому что там таких флажков пара десятков, по всем делать замучаешься.
но что мешало автоматически использовать имеющийся индекс по дате добавления, я не понимаю.

Re: за 5 лет работы ора дба ни разу не использовал INDEX_JOIN

Thursday, October 2nd, 2008 12:14 pm (UTC)

Потому что бы правильно оценить стоимость предиката (>= SYSDATE-30/1440) надо иметь глистограммы, а у тебя их спорю на деньги нет. Т.е. статистику то все собирают, а вот какую это вопрос.

select count(*) from user_histograms where tablename = 'ТВОЯТАБЛИЦАИМЯ'

а оракл кстате какой? 10-ка автоматически начала собирать статистику примерно какую надо.

Re: за 5 лет работы ора дба ни разу не использовал INDEX_JOIN

Thursday, October 2nd, 2008 12:20 pm (UTC)

у меня вообще ничего нет, я в данном случае выступаю в роли прикладного программиста.
а dba - индус в худшем смысле этого слова, от него чего-то внятного можно добиться, только рассказав 90% решения :(

Re: за 5 лет работы ора дба ни разу не использовал INDEX_JOIN