November 2019

S M T W T F S
      12
34 5 678 9
10111213141516
17181920212223
24252627282930

Style Credit

Expand Cut Tags

No cut tags
Friday, February 19th, 2010 05:16 pm

Выбираем данные из некоторой таблички:

SELECT foo,bar FROM table1 WHERE условия;

Всё отлично, данные выбираются. Но мне нужны не все, а только те, которые не встречаются в другой табличке.Проверяю парочку:

SELECT * FROM table2 WHERE foo='foo1';

Ура, ничего не находится. Значит, они должны появиться в итоговой выборке. Пишем окончательный запрос:

SELECT foo,bar FROM table1 WHERE условия
AND foo NOT IN (SELECT foo FROM table2);

И.. получаем индейскую национальную избу. 0 rows, и всё тут. Данных в table2 совершенно точно нет, но и из table1 они выбираться перестали.

Профессиональные DBA уже, наверное, догадались, в чём дело, но поскольку я не, мне на это понадобилось минут 10..

Оригинал этой записи. Комментировать можно тут или там.

Любые материалы из этого блога запрещается использовать на сайте livejournal.ru в любой форме и любом объёме

Friday, February 19th, 2010 07:19 pm (UTC)
Ну, классика же, "трехзначная" логика в SQL, да...

http://pcmag.ru/solutions/detail.php?ID=31704
Saturday, February 20th, 2010 10:17 am (UTC)
ага, она самая. кто ж знал, что она в NOT IN так вредно срабатывает..
Sunday, February 21st, 2010 08:58 pm (UTC)
Оно еще много где, грабельки там разложены вдумчиво и со вкусом, да... ;-)
Friday, February 19th, 2010 10:48 pm (UTC)
Лучше уж outer join делать на 2-ю таблицу. Так будет очевиднее что в 1-м варианте было нечто inner join.

PS. Только гадаю
Saturday, February 20th, 2010 10:18 am (UTC)
не лучше. поскольку из неё ничего не выбирается, а она используется только для проверки, то IN/NOT IN будет работать быстрее. По крайней мере, так мне сказали наши DBA
Saturday, February 20th, 2010 02:33 pm (UTC)
И каково же правильное/эффективное решение?
Saturday, February 20th, 2010 05:13 pm (UTC)
в данном конкретном случае:
SELECT foo,bar FROM table1 WHERE условия
AND foo NOT IN (SELECT foo FROM table2 WHERE foo IS NOT NULL);
Saturday, February 20th, 2010 08:19 pm (UTC)
а субд какая? а размер таблицы2 какой?

в общем _windwalker_ прав. Только есть нюанс преджойн и постджойн предикаты. В информиксе надо использовать ansi синтаксис left outer join, синтаксис outer не подойдет (он все предикаты воспринимает как преджойн).

а я бы написал:

SELECT foo,bar FROM table1 WHERE условия
AND not exists (SELECT 1 FROM table2 WHERE table1.foo=foo);
Saturday, February 20th, 2010 10:37 pm (UTC)
информикс. таблица 2 сильно большая, а таблица1 - вообще временная, полученная в результате пары других непростых запросов
Sunday, February 21st, 2010 07:54 am (UTC)
тогда попробуй not exists, скорее всего select 1 выполнится столько раз сколько строк в остается в (SELECT FROM table1 WHERE условия), причем это будут поиски по индексу, в саму таблицу даже заходить не надо. А в твоем варианте (SELECT foo FROM table2 WHERE foo IS NOT NULL) может выполняться очень долго.

С другой стороны оптимизатор умеет одно превращать в другое. Надо план смотреть.
Saturday, February 20th, 2010 09:45 pm (UTC)
Ггг, так это же ANSI NULL processing. Сам залип на днях на этом :о)