User manual

ManualsBrandsSybase ManualsOtherHome Theater System 12.7

パフォーマンス＆チューニング・ガイド

Sybase

12.7

Summary of content (212 pages)

PAGE 1
パフォーマンス＆チューニング・ガイド Sybase® IQ 12.
PAGE 2
ドキュメント ID：DC00283-01-1270-01 改訂：2006 年 6 月 Copyright © 1991-2006 by Sybase, Inc. All rights reserved. このマニュアルは Sybase ソフトウェアの付属マニュアルであり、新しいマニュアルまたはテクニカル・ノートで特に示されないかぎりは、後続のリリースにも付属します。このマニュアルの内容は、予告なく変更されることがありますが、 Sybase, Inc.
PAGE 3
目次はじめに .................................................................................................................................................. ix 第1章データベース・テーブルからのデータの選択 ........................................ 1 前提条件 ................................................................................................. 2 テーブル情報の表示 ............................................................................... 3 クエリ結果の順序付け ...........................................................................
PAGE 4
目次第3章クエリと削除の最適化 .......................................................................... 31 クエリ構築のヒント............................................................................. UNION ALL での GROUP BY がクエリ・パフォーマンスに与える影響............................................................................. Adaptive Server Anywhere による処理を引き起こす条件............ クエリ・プラン .................................................................................... クエリ評価オプション .....................................................
PAGE 5
目次第5章システム・リソースの管理 ................................................................. 103 パフォーマンス用語の概要................................................................. 104 パフォーマンス向上のための設計...................................................... 104 メモリ使用の概要 ............................................................................... 105 ページングによる使用可能メモリの増加.................................... 105 スワッピングをモニタするためのユーティリティ ..................... 106 サーバ・メモリ .......................................................
PAGE 6
目次データベース・サイズと構造の管理 ................................................. データベース・サイズの管理 ..................................................... インデックスの断片化の制御 ..................................................... カタログ・ファイル増大の最小化 .............................................. パフォーマンス向上のための非正規化....................................... 非正規化のリスク ....................................................................... 非正規化の短所........................................................................... 非正規化のパフォーマンスの利点 .....
PAGE 7
目次 NTFS キャッシュの使用..................................................................... 180 挿入とクエリのチューニング ............................................................. 181 適切にチューニングされた挿入オペレーションの特性 .............. 181 クエリのチューニング................................................................. 182 バックアップ操作のチューニング...................................................... 182 索引.............................................................................................................................................
PAGE 8
目次 viii Sybase IQ
PAGE 9
はじめにこのマニュアルの内容このマニュアルでは、パフォーマンスとチューニングの推奨事項について説明します。対象読者このマニュアルは、パフォーマンス上の問題を理解する必要があるシステム管理者とデータベース管理者を対象としています。リレーショナル・データベース・システムの基礎知識と、Sybase IQ のユーザ・レベルの基本的な経験があることを前提にしています。このマニュアルは、他のマニュアルとともに使用してください。このマニュアルの使用方法次のリストは、行う作業や必要性に応じてどの章を参照すべきかを示します。関連マニュアル • SELECT 文の構築については、「第 1 章データベース・テーブルからのデータの選択」を参照してください。 • ジョイン条件については、「第 2 章テーブルのジョイン」を参照してください。 • クエリの最適化については、「第 3 章クエリと削除の最適化」を参照してください。 • メモリ、ディスク I/O、CPU の調整については、「第 5 章システム・リソースの管理」を参照してください。 • パフォーマン
PAGE 10
• 『Sybase IQ トラブルシューティングおよびリカバリ・ガイド』－問題の解決方法、システム・リカバリの実行方法、データベースの修復方法を紹介しています。 • 『Sybase IQ エラー・メッセージ』－ Sybase IQ エラー・メッセージ (SQLCode、 SQLState、Sybase エラー・コードによって参照 )、および SQL プリプロセッサのエラーと警告を示します。 • 『Sybase IQ ユーティリティ・ガイド』－ Sybase IQ ユーティリティ・プログラムのリファレンス項目 ( 使用可能な構文、パラメータ、オプションなど ) について説明しています。 • 『Sybase IQ によるラージ・オブジェクト管理』－ Sybase IQ データ・リポジトリ内での BLOB (Binary Large Object) および CLOB (Character Large Object) の格納と取得について説明しています。このオプションの製品をインストールするには、別のライセンスが必要です。 • 『Sybase IQ インストールおよび設定ガ
PAGE 11
はじめに • 『Adaptive Server Anywhere SQL リファレンス・マニュアル』－ Adaptive Server Anywhere で使用する SQL 言語のリファレンスです。さらに、 Adaptive Server Anywhere のシステム・テーブルとプロシージャについても説明します。 Sybase Product Manuals Web サイトでも、SQL Anywhere Studio 9.0.2 コレクションの Adaptive Server Anywhere マニュアルを参照できます。Product Manuals (http://www.sybase.
PAGE 12
Web 上の Sybase 製品の動作確認情報 Sybase Web サイトの技術的な資料は頻繁に更新されます。 ❖ ❖ ❖ 製品動作確認の最新情報にアクセスする 1 Web ブラウザで Technical Documents を指定します。 (http://www.sybase.com/support/techdocs/) 2 [Certification Report] をクリックします。 3 [Certification Report] フィルタで製品、プラットフォーム、時間枠を指定して [Go] をクリックします。 4 [Certification Report] のタイトルをクリックして、レポートを表示します。コンポーネント動作確認の最新情報にアクセスする 1 Web ブラウザで Availability and Certification Reports を指定します。 (http://certification.sybase.
PAGE 13
はじめに 4 時間枠を指定して [Go] をクリックします。EBF/Maintenance リリースのリストが表示されます。鍵のアイコンは、自分が Technical Support Contact として登録されていないため、一部の EBF/Maintenance リリースをダウンロードする権限がないことを示しています。未登録ではあるが、Sybase 担当者またはサポート・コンタクトから有効な情報を得ている場合は、[Edit Roles] をクリックして、「Technical Support Contact」役割を MySybase プロファイルに追加します。 5 SQL 構文の表記規則 EBF/Maintenance レポートを表示するには [Info] アイコンをクリックします。ソフトウェアをダウンロードするには製品の説明をクリックします。このマニュアルで、構文の説明に使用する表記規則は次のとおりです。 • • SQL キーワードは大文字で示します。ただし、SQL キーワードは大文字と小文字を区別しないので、入力するときはどちらで入力してもかまいません。たとえば、S
PAGE 14
書体の表記規則表 1 に、このマニュアルで使用している書体の表記規則を示します。表 1: 書体の表記規則項目 Code 説明 User entry ユーザが入力するテキストには等幅 ( 固定幅 ) 文字フォントを使用します。「強調」 file names database objects サンプル・データベース SQL およびプログラム・コードは等幅 ( 固定幅 ) 文字フォントで表記します。強調する言葉は「」で囲みます。ファイル名は斜体で表記します。テーブル、プロシージャなどのデータベース・オブジェクトの名前は、印刷物ではゴシック体フォントで、オンラインでは斜体で表記します。 Sybase IQ にはサンプル・データベースが用意されています。Sybase IQ マニュアルで紹介している例の多くは、このサンプル・データベースによるものです。サンプル・データベースは小規模企業の例を示しています。データベースには、この企業の内部情報 (employee、department) とともに、製品情報 (product)、販売情報 (sles_order、custome
PAGE 15
はじめにアクセシビリティ・ツールの設定アクセシビリティ・ツールを効率的に使用するには、設定が必要な場合もあります。一部のスクリーン・リーダーは、テキストの大文字と小文字を区別して発音します。たとえば、すべて大文字のテキスト (ALL UPPERCASE TEXT など ) はイニシャルで発音し、大文字と小文字の混在したテキスト (MixedCase Text など ) は単語として発音します。構文規則を発音するようにツールを設定すると便利かもしれません。詳細については、ツールのマニュアルと『Sybase IQ の概要』の「スクリーン・リーダの使用」を参照してください。 Sybase のアクセシビリティに対する取り組みについては、 Sybase Accessibility (http://www.sybase.
PAGE 16
xvi Sybase IQ
PAGE 17
第 1 章この章についてデータベース・テーブルからのデータの選択この章では、基本的なクエリの構築と、製品設計を活用するための手法について説明します。ここではテーブルの内容の表示、クエリ結果の順序付け、カラムとローの選択、探索条件を使ったクエリの絞り込みを行うチュートリアル作業を実行します。高度なクエリ・パフォーマンスの推奨事項については、「第 3 章クエリと削除の最適化」を参照してください。内容トピック名前提条件ページ 2 テーブル情報の表示 3 クエリ結果の順序付け 5 カラムとローの選択 6 探索条件の使用 7 集約データの取得 11 分析データの取得 17 重複したローの削除 18 パフォーマンス＆チューニング・ガイド 1
PAGE 18
前提条件前提条件 DBISQL の代わりにグラフィカルなフロントエンド・ツールを使用してデータベースへのクエリを実行すると、ツールが生成する SQL 構文を表示できる場合があります。たとえば、InfoMaker では [ テーブル ] ペインタ・バーの [SQL 構文 ] ボタンを選択して SQL 文を表示できます。このチュートリアルでは、データベースから情報を取得するときに使用する SELECT 文について説明します。SELECT 文のことを一般にクエリと呼びます。これは、SELECT 文がデータベース内の情報についてデータベース・サーバに問い合わせるためです。注意 SELECT 文は用途の広いコマンドです。大きなデータベースから非常に具体的な情報を取得するアプリケーションでは、SELECT 文がきわめて複雑になる場合があります。このチュートリアルでは、単純な SELECT 文だけを使用します。以降のチュートリアルで、より高度なクエリについて説明します。 SELECT 文の完全な構文については、『Sybase IQ リファレンス・マニュアル』の「第 6 章 SQL 文」の「SEL
PAGE 19
第1章データベース・テーブルからのデータの選択テーブル情報の表示ここでは、employee テーブルのデータを表示します。このチュートリアルで使用するサンプル・データベースは、架空の会社のものです。データベースには、従業員、部署、注文などについての情報が格納されています。すべての情報はテーブルに編成されています。テーブルのリスト『Sybase IQ の概要』では、Sybase Central で [ テーブル ] フォルダを開いてテーブルのリストを表示する方法について説明しました。システム・ストアド・プロシージャの sp_iqtable を使用して、Interactive SQL からユーザ・テーブルをリストすることもできます。システム・ストアド・プロシージャは、Sybase IQ にストアド・プロシージャとして実装されているシステム関数です。 [SQL 文 ] ウィンドウで sp_iqtable と入力し、同じ名前のシステム・ストアド・プロシージャを実行します。システム・ストアド・プロシージャの詳細については、『Sybase IQ リファレンス・マニュアル』の「第 10
PAGE 20
テーブル情報の表示 SELECT 文の使用このレッスンでは、データベース内のテーブルの 1 つを表示します。使用するコマンドは、employee という名前のテーブル全体を表示します。次のコマンドを実行します。 SELECT * FROM employee アスタリスクは、テーブル内のすべてのカラムを表す省略記号です。 SELECT 文は employee テーブルのすべてのローとカラムを取得し、DBISQL [ 結果 ] ウィンドウに次の該当するものが表示されます。 emp_id manager_id emp_fname emp_lname dept_id 102 501 Fran Whitney 100 105 501 Matthew Cobb 100 129 902 Philip Chin 200 148 1293 Julie Jordan 300 160 501 Robert Breault 100 employee テーブルには、カラムに編成された複数のローが格納されています。各カラムには、emp_lname や emp_id
PAGE 21
第1章データベース・テーブルからのデータの選択クエリ結果の順序付けここでは、SELECT 文に ORDER BY 句を追加して、結果をアルファベット順または数値順に表示します。特に指定しないかぎり、 Sybase IQ ではテーブルのローが順不同で表示されます。テーブルのローを意味のある順序で表示した方が便利なことがよくあります。たとえば、従業員をアルファベット順で表示したいような場合です。従業員をアルファベット順にリストする次の例は、SELECT 文に ORDER BY 句を追加して、結果をアルファベット順に取得する方法を示します。 SELECT * FROM employee ORDER BY emp_lname 注意 emp_id manager_id emp_fname emp_lname 1751 1576 Alex Ahmed dept_id 400 1013 703 Joseph Barker 500 591 1576 Irene Barletta 400 191 703 Jeannette Bertrand 500
PAGE 22
カラムとローの選択カラムとローの選択多くの場合、表示する必要がある情報は、テーブル内の一部のカラムだけです。たとえば、従業員への誕生日カードを作成するには、emp_lname、dept_id、 birth_date の各カラムを表示すれば十分です。各従業員の姓、部署、誕生日をリストするここでは、各従業員の誕生日、姓、部署 ID を選択します。次のコマンドを入力します。 SELECT emp_lname, dept_id, birth_date FROM employee カラムの並べ替え emp_lname dept_id birth_date Whitney 100 1958-06-05 ... ... Cobb 100 1960-12-04 ... Chin 200 1966-10-30 ... Jordan 300 1951-12-13 ... Breault 100 1947-05-13 ...
PAGE 23
第1章データベース・テーブルからのデータの選択探索条件の使用ここでは、WHERE 句の複合探索条件、パターン・マッチング、探索条件ショートカットを使用して、日付を比較する手順について説明します。 employee テーブルにある一部の従業員の情報だけを表示したいことがあります。SELECT 文に WHERE 句を追加すると、テーブルから一部のローだけを選択できます。たとえば、John という名前の従業員だけを表示するとします。 ❖ John という名前のすべての従業員をリストするには • 次のコマンドを入力します。 SELECT * FROM employee WHERE emp_fname = 'John' emp_id アポストロフィおよび大文字と小文字の区別 manager_id emp_fname emp_lname dept_id 318 1576 John Crow 400 862 501 John Sheffield 100 1483 1293 John Letiecq 300 • 名前 'John' はアポストロフィ ( 一重
PAGE 24
探索条件の使用クエリでの日付の比較検索対象の正確な値がわからない場合や、一連の値を表示したい場合があります。WHERE 句で比較を使用すると、探索条件を満たす一連のローを選択できます。 1964 年 3 月 3 日より前に生まれた従業員をリストする次の例は、日付の不等号探索条件の使い方を示します。次のコマンドを入力します。 SELECT emp_lname, birth_date FROM employee WHERE birth_date < 'March 3, 1964' emp_lname birth_date Whitney 1958-06-05 00:00:00.000 Cobb 1960-12-04 00:00:00.000 Jordan 1951-12-13 00:00:00.000 Breault 1947-05-13 00:00:00.000 Espinoza 1939-12-14 00:00:00.000 Dill 1963-07-19 00:00:00.
PAGE 25
第1章データベース・テーブルからのデータの選択探索条件でのパターン・マッチングもう 1 つの便利な検索方法が、パターンによる検索です。SQL では、LIKE という語を使用してパターンを検索します。LIKE の使い方について、例を挙げて説明します。姓が BR で始まる従業員をリストする次のコマンドを入力します。 SELECT emp_lname, emp_fname FROM employee WHERE emp_lname LIKE 'br%' emp_lname emp_fname Breault Robert Braun Jane 探索条件内の % は、BR という文字の後に別の文字が何文字続いてもかまわないことを示します。姓検索の修飾姓が BR で始まり、その直後または数文字後に T という文字を含み、T で終わるかさらに別の文字が続くすべての従業員をリストするには、次のコマンドを使用します。 SELECT emp_lname, emp_fname FROM employee WHERE emp_lname LIKE 'BR%T%' emp_lname
PAGE 26
探索条件の使用発音によるローのマッチング SOUNDEX 関数を使用すると、スペルだけでなく読みによってもローをマッチングできます。たとえば、電話メッセージが残されていて、その宛先が “Ms.
PAGE 27
第1章データベース・テーブルからのデータの選択集約データの取得ここでは、集約情報を返すクエリを構築する方法について説明します。集約情報の例を次に示します。 • カラム内のすべての値の合計 • カラム内のエントリの数 • カラム内のエントリの平均値集合関数の概要従業員の人数を調べたいとします。次の文は、employee テーブルのローの数を取得します。 SELECT count( * ) FROM employee count(*) 75 このクエリによって、1 つのカラム (count(*) というタイトル ) と 1 つのロー ( 従業員数が格納されている ) だけで構成されるテーブルが返されます。次のコマンドは、やや複雑な集約クエリです。 SELECT count( * ), min( birth_date ), max( birth_date ) FROM employee count(*) min( birth_date ) max( birth_date ) 75 1936-01-02 1973-01-18 このクエリの結果セットは、3 つのカラムと 1
PAGE 28
集約データの取得集合関数によるグループ化されたデータの取得テーブル全体についての情報を取得することに加えて、集合関数をローのグループに対して使うこともできます。ローのグループに対する集合関数の使用各営業担当者が受け持つ注文数をリストするには、次のコマンドを入力します。 SELECT sales_rep, count( * ) FROM sales_order GROUP BY sales_rep sales_rep count(*) 129 57 195 50 299 114 467 56 667 54 このクエリの結果は、各営業担当者の ID 番号別に、営業担当者の ID が格納されたローと、sales_order テーブル内でその ID 番号を持つローの数で構成されます。 GROUP BY 句を使用すると、結果のテーブルには、GROUP BY で指定したカラムで見つかった値別のローが表示されます。グループの制限 WHERE 句を使用して、クエリでローを制限する方法についてはすでに説明しました。GROUP BY 句の制限には、HAVING キーワードを使用
PAGE 29
第1章 WHERE と GROUP BY の使用データベース・テーブルからのデータの選択注文数が 55 を超えており、ID が 1000 より大きいすべての営業担当者をリストするには、次のコマンドを入力します。 SELECT sales_rep, count( * ) FROM sales_order WHERE sales_rep > 1000 GROUP BY sales_rep HAVING count( * ) > 55 Sybase IQ クエリ・オプティマイザは、それによってパフォーマンスが向上する場合、述部を HAVING 句から WHERE 句に移動します。たとえば、上記の例で WHERE 句の代わりに述部を次のように指定した場合、クエリ・オプティマイザは述部を WHERE 句に移動します。 GROUP BY sales_rep HAVING count( *) > 55 AND sales_rep > 1000 Sybase IQ は、この最適化を (OR や IN を伴わない ) 単純な条件を使って実行します。このため、WHERE 句と HAVING 句の両方を含む
PAGE 30
集約データの取得 year model color 1991 Chevrolet blue sales 54 1991 Chevrolet red 95 1991 Chevrolet white 49 1991 Chevrolet NULL 198 1991 Ford blue 52 1991 Ford red 55 1991 Ford white 9 1991 Ford NULL 116 1991 NULL NULL 314 NULL NULL NULL 657 このクエリを処理するときに、Sybase IQ は最初に、指定された 3 つすべてのグループ化式 (year、model、color) によってデータをグループ化し、次に最後の式 (color) を除くすべてのグループ化式によってデータをグループ化します。 5 番目のローの NULL は、color カラムの ROLLUP 値、つまり、そのモデルのすべての色の合計販売数を示します。343 は、1990 年のすべてのモデルと色の合計販売数を表し、314 は
PAGE 31
第1章データベース・テーブルからのデータの選択次のクエリは、GROUPING 関数を GROUP BY CUBE と組み合わせた使用例です。 SELECT CASE GROUPING ( state ) WHEN 1 THEN 'ALL' ELSE state END AS c_state, CASE GROUPING ( gender ) WHEN 1 THEN 'ALL' ELSE gender END AS c_gender, CASE GROUPING ( education ) WHEN 1 THEN 'ALL' ELSE education END AS c_education, COUNT(*), CAST (ROUND ( AVG ( income ), 2 ) AS NUMERIC (18,2)) AS average FROM census GROUP BY CUBE (state, gender, education); このクエリの結果は次のとおりです。CUBE が生成した小計ローを示す NULL 値が、クエリ内の指定によって小計ローで ALL に置き換わっています。 c_
PAGE 32
集約データの取得 c_state c_gender c_education count(*) average ALL m ALL 12 62000.00 ALL f BA 3 48333.33 ALL m HS 1 55000.00 ALL m MS 4 76000.00 ALL m BA 7 55000.00 ALL f MS 2 65000.00 ALL f HS 4 45000.00 NH ALL HS 2 50000.00 NH ALL MS 2 67000.00 MA ALL MS 4 75000.00 MA ALL HS 3 45000.00 MA ALL BA 7 52142.86 NH ALL BA 3 55000.
PAGE 33
第1章データベース・テーブルからのデータの選択分析データの取得ここでは、分析情報を返すクエリを構築する方法について説明します。統計関数には、ランク付けと逆分散統計の 2 種類があります。ランク付け統計関数は、グループ内の項目をランク付けしたり、分散統計を計算したり、結果セットを複数のグループに分割したりします。逆分散統計関数は、K- 理論パーセンタイル値を返します。これは、ひとまとまりのデータの値として許容し得るしきい値を決定する際に使用します。ランク分析関数には、RANK、DENSE_RANK、PERCENT_RANK、NTILE があります。逆分散統計関数には、PERCENTILE_CONT と PERCENTILE_DISC があります。たとえば、自動車販売店の販売状況を調べたいとします。NTILE 関数で、各販売店が販売した車の台数に基づいて、販売店を 4 つのグループに分類します。 ntile = 1 になっているのは、車の販売台数で上位 25% までのディーラです。 SELECT dealer_name, sales, NTILE(4) OVER ( ORDER BY
PAGE 34
重複したローの削除 OVER 句は、関数がクエリの結果セットに対して処理を行うことを示します。結果セットは、FROM、WHERE、GROUP BY、HAVING の各句がすべて評価された後で返されるローです。OVER 句には、ランク付け統計関数の計算の対象となるローのデータ・セットを定義します。同様に、逆分布関数では WITHIN GROUP (ORDER BY) 句を指定する必要があります。ORDER BY 句は、百分位関数を実行する式と、各グループでローをソートする順序を指定します。この ORDER BY 句は、WITHIN GROUP 句の中でだけ使用されるもので、SELECT の ORDER BY とは異なります。WITHIN GROUP 句は、クエリの結果を並べ替えて、関数が結果を計算するためのデータ・セットを形成します。分析関数の詳細については、『Sybase IQ リファレンス・マニュアル』の「第 5 章 SQL 関数」の「統計関数」を参照してください。個別の分析関数については、「SQL 関数」の章の各関数の項を参照してください。重複したローの削除 SELECT 文の
PAGE 35
第 2 章この章について内容テーブルのジョインこの章では、複数のテーブルにある情報を参照する方法と、さまざまな種類のジョインについて説明します。ここでは、テーブルをジョインするチュートリアル作業を実行します。トピック名外積を使用したテーブルのジョインページ 19 ジョインの制限 20 テーブル間の関係 21 ジョイン演算子 22 アドホック・ジョインとジョイン・インデックスの使用 25 ジョインとデータ型 25 ストアまたはデータベース間ジョインのサポート 26 リモート・データベースと異種データベースのクエリ 27 サブクエリによるジョインの置き換え 28 外積を使用したテーブルのジョインサンプル・データベースに、会社の財務データをリストする fin_data というテーブルがあります。各データ・レコードには、そのレコードの部署と、それが支出レコードか収入レコードかを示す code カラムがあります。 fin_data テーブルには 84 のローがあります。 2 つのテーブルから同時に情報を取り出すには、SELECT クエリの FROM
PAGE 36
ジョインの制限外積ジョインは、ジョインを理解するための単純な出発点にすぎず、それ自体はあまり役に立ちません。これ以降の項で、より選択性の高いジョインを構築する方法について説明します。このジョインは、外積テーブルへの制限の適用と考えることができます。ジョインの制限外積ジョインを有効に利用するには、何らかの条件を満たすローだけを結果に含める必要があります。ジョイン条件と呼ばれるこの条件では、比較演算子 (=、=>、< など ) を使用して、あるテーブルの 1 つのカラムを別のテーブルの 1 つのカラムと比較します。これにより、外積の結果から一部のローを除外します。たとえば、前の項のジョインを有効に利用するには、sales_order テーブルの sales_rep と employee テーブルの従業員番号が一致するローだけを結果に含めるように指定します。これにより、各ローには注文と、その注文を担当する営業担当者の情報が格納されます。例1 これを実行するには、前のクエリに WHERE 句を追加し、従業員とその担当登録のリストを表示します。 SELECT * FROM sales_o
PAGE 37
第2章相関名テーブルのジョイン相関名は、テーブルの特定のインスタンスのエイリアスです。このエイリアスは、1 つの文中でのみ有効です。相関名を作成するには、テーブル名のすぐ後ろに、テーブル名の省略形をキーワード AS で区切って指定します。それ以降は、修飾子としてテーブル名の代わりにこの省略形を使用する必要があります。 SELECT E.emp_lname, S.id, S.order_date FROM sales_order AS S, employee AS E WHERE S.sales_rep = E.emp_id ORDER BY E.
PAGE 38
ジョイン演算子外部キーによって関連付けられたテーブル asiqdemo データベースのいくつかのテーブルは、データベース内の他のテーブルを参照しています。たとえば、sales_order テーブルには、注文を担当する従業員を示す sales_rep カラムがあります。sales_order テーブルには、従業員をユニークに識別するために必要な最小限の情報だけが格納されています。 sales_order テーブルの sales_rep カラムは、employee テーブルに対する外部キーになっています。外部キー外部キーは、他のテーブルの候補キーの値を含む 1 つまたは複数のカラムです ( 候補キーの詳細については、『Sybase IQ システム管理ガイド』の「第 5 章データベース・オブジェクトの使用」を参照してください )。従業員データベース内の各外部キーの関係は、2 つのテーブル間の矢印によって図示されます。『Sybase IQ の概要』の図 1-1 (11 ページ ) のサンプル・データベースの図に、これらの矢印が示されています。矢印は関係の外部キー側を起点とし、候補キー側
PAGE 39
第2章テーブルのジョインジョイン演算子 (KEY JOIN) は、単に WHERE 句の入力の手間を省くためのもので、2 つのクエリはまったく同じものです。『Sybase IQ の概要』の asiqdemo データベースの図では、外部キーがテーブル間の線で表されています。図中で 2 つのテーブルが線で結合されていれば、 KEY JOIN 演算子を使用できます。キー・ジョインによるクエリで期待どおりの結果を得るには、アプリケーションで外部キーを強制的に適用する必要があります。複数のテーブルのジョインジョイン演算子を使用して、複数のテーブルをジョインできます。次のクエリでは、4 つのテーブルを使用して、注文の合計額を顧客別にリストしています。 customer、sales_order、sales_order_items、product の 4 つのテーブルを、テーブルの各ペア間の 1 つの外部キー関係で接続しています。 SELECT company_name, CAST( SUM(sales_order_items.quantity * product.
PAGE 40
ジョイン演算子ナチュラル・ジョインを使用したテーブルのジョイン NATURAL JOIN 演算子は、共通のカラム名に基づいて 2 つのテーブルをジョインします。言い換えると、Sybase IQ が各テーブルに共通するカラムを結び付ける WHERE 句を生成します。例たとえば、次のようなクエリがあるとします。 SELECT emp_lname, dept_name FROM employee NATURAL JOIN department この例では、データベース・サーバが 2 つのテーブルを参照し、共通するカラム名は dept_id だけであると判断します。次の ON フレーズが内部的に生成され、ジョインの実行に使用されます。 FROM employee JOIN department ... ON employee.dept_id = department.
PAGE 41
第2章テーブルのジョインアドホック・ジョインとジョイン・インデックスの使用クエリで参照されるジョイン・カラムにジョイン・インデックスを定義している場合、Sybase IQ は自動的にそれらを使用してクエリ処理を高速化します ( ジョイン・インデックスの定義については、『Sybase IQ システム管理ガイド』の「第 6 章 Sybase IQ インデックスの使用」を参照してください )。ジョイン・インデックスを使用しないジョインを「アドホック・ジョイン」呼びます。クエリでいくつものテーブルを参照しており、その中にジョイン・インデックスが定義されていないテーブルがある場合、Sybase IQ は定義されているテーブルではジョイン・インデックスを、それ以外のテーブルではアドホック・ジョインを使用します。可能なすべてのジョインに対してジョイン・インデックスを作成することはできないため、ときにはアドホック・ジョインが必要になることがあります。 Sybase IQ の最適化によって、クエリはジョイン・インデックスなしでも同等かそれ以上のパフォーマンスで実行されます。ジョイン・インデック
PAGE 42
ストアまたはデータベース間ジョインのサポートストアまたはデータベース間ジョインのサポートこの項では、ストア間またはデータベース間ジョインに対する現在のサポートを明確にします。 Sybase IQ データベース内でのテーブルのジョイン Adaptive Server Enterprise テーブルと Sybase IQ テーブルのジョイン指定された Sybase IQ データベース内では、あらゆる種類のジョインがサポートされます。つまり、カタログ・ストアの任意のシステムまたはユーザ・テーブルを、IQ ストアの任意のテーブルに任意の順序でジョインできます。 Sybase IQ テーブルと Adaptive Server Enterprise データベースのテーブルのジョインは、次の条件下でサポートされます。 • Sybase IQ データベースは、ローカル・データベースとリモート・データベースのどちらでもかまいません。 • ASE で Sybase IQ テーブルをプロキシ・テーブルとして使用する場合は、テーブル名を 30 文字以内にしてください。 • ローカルの Adapt
PAGE 43
第2章 Adaptive Server Anywhere テーブルと Sybase IQ テーブルのジョインテーブルのジョインデータベースが BLANK PADDING OFF を指定して構築された場合、CHAR データ型は Adaptive Server Anywhere と Sybase IQ の間で互換性がありません。文字データをジョイン・キーとして使用して、Adaptive Server Anywhere テーブルと Sybase IQ テーブルの間でデータベースのジョインを実行する場合は、 BLANK PADDING ON を指定して CHAR データ型を使用します。注意 Sybase IQ CREATE DATABASE は、新しいデータベースについては BLANK PADDING OFF をサポートしなくなりました。この変更は、既存のデータベースには影響しません。BlankPadding database プロパティを使用して、既存のデータベースの状態をテストすることができます。 select db_property ( ‘BlankPadding’ ) Sybase
PAGE 44
サブクエリによるジョインの置き換え 3 プロキシ・データベース名を各リモート・テーブルの修飾名として使用し、SELECT 文でプロキシ・テーブルを参照します。たとえば、次のような文を発行します。 SELECT a.c_custkey, b.o_orderkey FROM proxy_asiqdemo..cust2 a, asiqdemo..orders b WHERE a.c_custkey = b.
PAGE 45
第2章外部ジョインの使用テーブルのジョイン前項のチュートリアルのジョインは、より正確には「内部ジョイン」と呼ばれます。外部ジョインを明示的に指定します。この場合は、GROUP BY 句も必要です。 SELECT company_name, MAX( sales_order.id ),state FROM customer KEY LEFT OUTER JOIN sales_order WHERE state = 'WA' GROUP BY company_name, state サブクエリの使用 company_name max(sales_order.
PAGE 46
サブクエリによるジョインの置き換えクエリの別の表現方法受注した 10 枚のタンクトップが出荷され、タンクトップの数量カラムの値が 18 になった場合にどうなるかを考えてみます。サブクエリを使ったクエリは、ウールの帽子とタンクトップの両方のすべての注文をリストします。これに対して、最初に使用した文は次のように変更する必要があります。 SELECT * FROM sales_order_items WHERE prod_id IN ( 401, 300 ) ORDER BY ship_date DESC サブクエリを使用するコマンドは、データベースのデータが変更されてもそのまま機能するように、改善されています。サブクエリについては、次の点に注意してください。 30 • NOT EXISTS 述部を使用するクエリなど、ジョインの構築に問題がある場合もサブクエリが役立つことがあります。 • サブクエリが返せるのは 1 つのカラムだけです。 • サブクエリは、比較の引数、IN、または EXISTS 句としてのみ使用できます。 • 外部ジョインの ON 句の中に、サブクエリを使用す
PAGE 47
第 3 章この章についてクエリと削除の最適化この章では、次のようなクエリと削除のパフォーマンスに関する推奨事項について説明します。 • 処理速度の速いクエリの構築 • クエリ・プランの使用 • クエリ処理オプションの設定 • 削除オペレーションの最適化内容トピック名クエリ構築のヒントページ 31 クエリ・プラン 35 クエリ処理の制御 37 削除オペレーションの最適化 40 クエリ構築のヒントここでは、クエリ構造を改良するためのヒントを示します。 • サブクエリを含むコマンド文をジョインとして構成することによって、実行速度を高めることができる場合があります。 • GROUP BY 句で複数のカラムをグループ化する場合、カラムに対応するユニークな値をもとに降順にカラムをリストします。これによって最適なクエリのパフォーマンスが実現されます。 • ジョイン・インデックスを使用すると、多くの場合、ジョイン・クエリはアドホック・ジョインより高速に実行されますが、より多くのディスク領域が必要となります。ただし、ジョイン・クエリがマルチテー
PAGE 48
クエリ構築のヒント UNION ALL での GROUP BY がクエリ・パフォーマンスに与える影響パフォーマンスを向上させるために、非常に大きなテーブルを複数の小さなテーブルにセグメント化し、ビューで UNION ALL を使用してアクセスすることがよくあります。このようなビューを GROUP BY とともに使用する特定の非常に個別的なクエリでは、Sybase IQ オプティマイザがいくつかの GROUP BY 処理を UNION ALL の各分岐に挿入して、処理を並列に実行し、結果を結合することでパフォーマンスを向上させることができます。分割 GROUP BY と呼ばれるこの方法では、最上位レベルの GROUP BY で処理されるデータの量が減少し、その結果、クエリ処理時間が減少します。パフォーマンスが向上するのは、UNION ALL で GROUP BY を使用する特定のクエリだけです。たとえば、次の簡単なクエリは分割 GROUP BY によってパフォーマンスが向上します。 CREATE VIEW vtable (v1 int, v2 char(4)) AS SELECT a1, a
PAGE 49
第3章 • クエリと削除の最適化クエリ内の集合関数で DISTINCT が指定されていない場合に、分割 GROUP BY によってクエリのパフォーマンスが向上する可能性があります。次のクエリでは SUM DISTINCT を使用しているため、分割 GROUP BY によるメリットはありません。 CREATE VIEW viewA (va1 int, va2 int, va3 int, va4 int) AS SELECT b1, b2, b3, b4 FROM tableB UNION ALL SELECT c1, c2, c3, c4 FROM tableC; SELECT SUM(DISTINCT va1) FROM viewA GROUP BY va3; • 分割 GROUP BY によってクエリのパフォーマンスを向上させるには、追加の GROUP BY 演算子の処理に使われる集合情報とデータを格納するために、テンポラリ共有バッファ・キャッシュに十分なメモリが必要です。 CREATE VIEW viewA (va1 int, va2 int, va3 int, va4 int) A
PAGE 50
クエリ構築のヒント • 分割 GROUP BY の例分割 GROUP BY によってクエリのパフォーマンスを向上させるには、 AGGREGATION_PREFERENCE データベース・オプションをデフォルト値の 0 に設定します。これにより、Sybase IQ オプティマイザは GROUP BY に適用する最善のアルゴリズムを判断できるようになります。Sybase IQ オプティマイザが GROUP BY の処理にソート・アルゴリズムを選択するように AGGREGATION_PREFERENCE の値が設定されている場合は、分割 GROUP BY によるメリットはありません。AGGREGATION_PREFERENCE オプションを使用すると、オプティマイザが GROUP BY の処理に選択するアルゴリズムを上書きできます。分割 GROUP BY では、この値を 1 または 2 に設定しないでください。次の例では、tableA という大きなテーブルを、tabA1、tabA2、tabA3、tabA4 という 4 つの小さなテーブルにセグメント化しています。この 4 つの小さなテーブル
PAGE 51
第3章クエリと削除の最適化 Sybase IQ と Adaptive Server Anywhere の違いの詳細については、『Sybase IQ リファレンス・マニュアル』の「付録 A 他の Sybase データベースとの互換性」を参照してください。クエリ・プラン最も効果的な構文を使用していなくても、正しいインデックスを作成していれば、通常は Sybase IQ クエリ・オプティマイザによって、最も効率的な方法でクエリを実行できます。もちろん、クエリを正しく設計することは重要です。クエリを計画する場合に、クエリの実行速度と得られる結果の正確さが主要な問題点となります。クエリを実行する前に、Sybase IQ クエリ・オプティマイザはクエリ・プランを作成します。Sybase IQ では、これ以降の項で説明するオプションを使用して、クエリ・プランを調査および変更し、クエリを評価できます。このオプションを指定する方法の詳細については、『Sybase IQ リファレンス・マニュアル』を参照してください。注意整数値を指定できるデータベース・オプションでは、小数の option
PAGE 52
クエリ・プラン • NOEXEC －このオプションを ON に設定すると、Sybase IQ はクエリ・プランを生成しますが、クエリを実行しません。ただし、 EARLY_PREDICATE_EXECUTION オプションが ON の場合を除きます。 • QUERY_DETAIL －このオプションと、QUERY_PLAN または QUERY_PLAN_AS_HTML の両方が ON の場合、Sybase IQ はクエリ・プランを生成するときに、クエリについての追加情報を表示します。QUERY_PLAN と QUERY_PLAN_AS_HTML が OFF の場合、このオプションは無視されます。 • QUERY_PLAN －このオプションが ON に設定されている場合 ( デフォルト )、Sybase IQ はクエリについてのメッセージを生成します。ジョイン・インデックスの使用方法、ジョイン順序、クエリのジョイン・アルゴリズムについてのメッセージなどが生成されます。 • QUERY_PLAN_AFTER_RUN －このオプションを ON に設定すると、クエリの実行が終了し
PAGE 53
第3章クエリと削除の最適化クエリ・ツリーオプティマイザは、クエリ内のデータの流れを表すクエリ「ツリー」を作成します。クエリ・プランでは、クエリ・ツリーが .iqmsg ファイル内にテキスト形式で表示されます。オプションで、グラフィカル形式のクエリ・ツリーも作成できます。クエリ・ツリーはノードで構成されます。それぞれのノードは処理の段階を表します。ツリーの一番下のノードはリーフ・ノードです。各リーフ・ノードは、クエリ内のテーブルまたはプリジョイン・インデックス・セットを表します。プランの最上部にあるのは、演算子ツリーのルートです。情報はテーブルから上方向に、ジョイン、ソート、フィルタ、格納、集合、サブクエリを表す演算子を通じて流れます。 HTML クエリ・プランの使用クエリ・プランを初めて使用するときは、QUERY_PLAN_AS_HTML オプションを ON に設定することをおすすめします。このオプションを設定すると、 .
PAGE 54
クエリ処理の制御クエリの優先度の設定処理をキューで待機しているクエリは、そのクエリを送信したユーザの優先度、そしてクエリが送信された順序の順に実行されます。優先度の高いクエリがすべて実行されるまで、優先度の低いキューのクエリは実行されません。次のオプションは、クエリにユーザ別の処理の優先度を割り当てます。 • IQGOVERN_PRIORITY －処理キューで待機しているクエリに数字の優先度 (1、2、または 3 で、1 が最も高い ) を割り当てます。 • IQGOVERN_MAX_PRIORITY － DBA はユーザまたはグループの IQGOVERN_PRIORITY に上限値を設定できます。 • IQ_GOVERN_PRIORITY_TIME －優先度の高い ( 優先度 1 の ) クエリが、指定した時間より長く -iqgovern キューで待機している場合に、優先度の高いユーザを開始できます。クエリの優先度を調べるには、sp_iqcontext ストアド・プロシージャによって返される IQGovernPriority 属性を確認します。クエリ最適化オプション
PAGE 55
第3章クエリと削除の最適化 • ENABLED_ORDERED_PUSHDOWN_INSERTION －クエリ・オプティマイザが、ジョイン・オプティマイザによって選択されたプッシュダウン・ジョイン用のセミジョイン述部に追加する方法を制御します。それらのセミジョインによって間接的に影響を受ける可能性のある中間のジョインを再分析します。通常は、このオプションを変更しないでください。 • IN_SUBQUERY_PREFERENCE － IN サブクエリを処理するためのアルゴリズムの選択を制御します。このオプションは、主に内部用として設計されているため、経験のあるデータベース管理者のみが使用してください。 • INDEX_PREFERENCE －クエリ処理に使用するインデックスを設定します。Sybase IQ オプティマイザは、通常最適なインデックスを使用して、ローカルな WHERE 句の述部など、1 つの IQ インデックスの範囲内で処理できる操作を実行します。このオプションは、テスト目的にオプティマイザの選択を無効にするために使用します。通常の使用の際はこのオプション
PAGE 56
削除オペレーションの最適化通常の状況では、評価を遅らせることにメリットはなく、クエリの処理が遅くなるだけです。ただし、これによって次の 4 つの動作のいずれかをクエリ内のもっと後ろに移動できます。 • 最適化の前 • 初回の「最初のフェッチ」時 • 2 回目の「最初のフェッチ」時 ( 相関サブクエリの内部またはネストループ・プッシュダウン・ジョインの左側のみ ) • インデックスの不使用 ( 水平処理 ) 構文、パラメータ、使用例については、『Sybase IQ リファレンス・マニュアル』の「第 3 章 SQL 言語の要素」の「ユーザ指定の条件ヒント文字列」を参照してください。削除オペレーションの最適化 Sybase IQ は、削除オペレーションを処理するために次の 3 つのアルゴリズムから 1 つを選択します。 • スモール・デリートスモール・デリートでは、非常に少数のグループからローを削除するときに最適なパフォーマンスが得られます。通常は、削除するローが 1 つだけか、HG (High_Group) インデックスを持つカラムに等号述部がある場合に選択されます
PAGE 57
第3章クエリと削除の最適化削除コスト 12.
PAGE 58
削除オペレーションの最適化 42 Sybase IQ
PAGE 59
第 4 章この章について OLAP の使用オンライン分析処理 (OLAP: Online Analytical Processing) は、リレーショナル・データベースに格納されている情報を効率的に分析するための手法です。 OLAP を使用すると、データをさまざまな次元で分析し、小計ローを含んだ結果セットを取得し、データを多次元キューブに編成するという処理をすべて１つの SQL クエリで行うことができます。また、フィルタを使用してデータを絞り込み、結果セットを迅速に返すことができます。この章では、 Sybase IQ がサポートする SQL/OLAP 関数について説明します。注意以降で紹介する OLAP の例に出てくるテーブルは、asiqdemo データベースに含まれています。内容トピック名 OLAP についてページ 44 GROUP BY 句の拡張機能 47 統計関数 61 単純な集合関数 61 ウィンドウ 62 ランク付け関数 75 ウィンドウ集合関数 80 統計集合関数 81 分散統計関数 82 数値関数 85 OLAP
PAGE 60
OLAP について OLAP について 1999 年の SQL 標準の改正によって、ANSI SQL 標準に複雑なデータ分析操作を行うための拡張機能が導入されました。Sybase IQ では、以前のリリースでこれらの SQL 拡張機能の一部が取り入れられていますが、Sybase IQ 12.
PAGE 61
第4章 OLAP の使用 OLAP の利点 OLAP 関数を GROUPING、CUBE、ROLLUP という拡張機能と組み合わせて使用すると、2 つの大きな利点があります。第一に、多次元のデータ分析、データ・マイニング、時系列分析、傾向分析、コストの割り当て、ゴール・シーク、一時的な多次元構造変更、非手続き型モデリング、例外の警告を多くの場合 1 つの SQL 文で実行できます。第二に、OLAP のウィンドウおよびレポート集合関数では、ウィンドウという関係演算子を使用することができ、これはセルフジョインや相関サブクエリを使用するセマンティック的に等価なクエリよりも効率的に実行できます。OLAP を使用して取得した結果セットには小計ローを含めることができ、この結果セットを多次元キューブに編成することもできます。詳細については、「ウィンドウ」(62 ページ ) を参照してください。さまざまな期間での移動平均と移動和を計算したり、選択したカラムの値が変化したときに集計とランクをリセットしたり、複雑な比率を単純な言葉で表現したりできます。1 つのクエリ式のスコープ内で、それぞれ独自のパ
PAGE 62
OLAP について 4 GROUP BY 句の式の重複しない値に基づいて、結果のローがグループ化されます (NULL はそれぞれのドメインで特殊な値として扱われます )。 PARTITION BY 句がある場合は、GROUP BY 句の式はパーティション・キーとして使用されます。 5 各パーティションについて、SELECT リストまたは HAVING 句の集合関数が評価されます。いったん集合関数を適用すると、中間の結果セットには個々のテーブル・ローが含まれなくなります。新しい結果セットには、 GROUP BY の式と、各パーティションについて計算した集合関数の値が含まれます。 6 HAVING 句の条件が結果グループに適用されます。HAVING 句の条件を満たさないグループが除外されます。 7 PARTITION BY 句で定義された境界に基づいて結果が分割されます。結果ウィンドウについて、OLAP ウィンドウ関数 ( ランク付け関数および集合関数 ) が計算されます。図 4-1: 実行のセマンティック・フェーズ詳細については、「文法規則 2」(98 ページ ) を参照
PAGE 63
第4章 OLAP の使用 GROUP BY 句の拡張機能 GROUP BY 句の拡張機能により、次のような処理を行う複雑な SQL 文を書くことができます。 • 入力ローを複数の次元に分割し、結果グループの複数のサブセットを組み合わせる。 • “ データ・キューブ ” を作成し、データ・マイニング分析のための疎密度の多次元結果セットを用意する。 • 元のグループを含んだ結果セットを作成する ( 必要に応じて、小計ローと合計ローを含める場合もある )。 ROLLUP や CUBE などの OLAP の Grouping() ( グループ化 ) 操作は、プレフィクスや小計ローとして概念化できます。プレフィクス GROUP BY 句を含むクエリでは、プレフィクスのリストが作成されます。プレフィクスとは、GROUP BY 句の項目のサブセットであり、クエリの GROUP BY 句の項目のうち最も右にある 1 つまたは複数の項目を除外することで作成されます。残りのカラムはプレフィクス・カラムと呼ばれます。 ROLLUP 例 1 次に示す ROLLUP のクエリの例では、GROUP BY
PAGE 64
GROUP BY 句の拡張機能 GROUP BY での ROLLUP と CUBE プレフィクスに関する一般的なグループ化を簡単に指定するために、2 つの重要な構文簡略化パターンが用意されています。1 つ目のパターンは ROLLUP、 2 つ目のパターンは CUBE と呼ばれます。 GROUP BY ROLLUP ROLLUP 演算子には、引数として適用するグループ化の式を、次の構文の中で順序リストで指定します。 SELECT … [ GROUPING (column-name) … ] … GROUP BY [ expression [, … ] | ROLLUP ( expression [, … ] ) ] GROUPING は、カラム名をパラメータとして受け取り、表 4-1 に示すようにブール値を返します。表 4-1: ROLLUP 演算子が指定された GROUPING によって返される値結果値の種類 GROUPING の戻り値 ROLLUP 演算子によって作成された NULL 1(真) ローが小計であることを示す NULL 1(真) ROLLUP 演算子によって作成された
PAGE 65
第4章 ROLLUP クエリの例 SELECT A, B, C, SUM( D ) FROM T1 GROUP BY ROLLUP (A, B, C); OLAP の使用 ROLLUP を使用せずに記述した同じ内容のクエリ SELECT * FROM ( ( SELECT A, B, C, SUM( D ) GROUP BY A, B, C ) UNION ALL ( SELECT A, B, NULL, SUM( D ) GROUP BY A, B ) UNION ALL ( SELECT A, NULL, NULL, SUM( D ) GROUP BY A ) UNION ALL ( SELECT NULL, NULL, NULL, SUM( D ) ) ) 小計ローはデータの分析に役立ちます。特に、データが大量にある場合、データにさまざまな次元がある場合、データがさまざまなテーブルに含まれている場合、あるいはまったく異なるデータベースに含まれている場合に威力を発揮します。たとえば販売マネージャが、売上高についてのレポートを営業担当者別、地域別、四半期別に整理して、売上パターンの理解に役立
PAGE 66
GROUP BY 句の拡張機能次の例では、結果セットの中に Grouping() カラムが含まれています。強調表示されているローは、小計ローであるために NULL を含んでいるのではなく、入力データの結果として NULL を含んでいるローです。Grouping() カラムは強調表示されています。このクエリは、employee テーブルと sales_order テーブルの間の外部ジョインです。このクエリでは、テキサス、ニューヨーク、またはカリフォルニアに住んでいる女性従業員を選択しています。営業担当者でない ( したがって売上がない ) 女性従業員については、カラムに NULL が表示されます。 SELECT employee.emp_id AS Employee, year(order_date) AS Year, COUNT(*) AS Orders, GROUPING(Employee) AS GE, GROUPING(Year) AS GY FROM employee LEFT OUTER JOIN alt_sales_order ON employee.
PAGE 67
第4章 OLAP の使用小計ローの各カラムの値は、次のようになっています。 • プレフィクスに含まれているカラム－そのカラムの値です。たとえば前述のクエリでは、Year=2000 のローに関する小計ローの Year カラムの値は 2000 になります。 • プレフィクスから除外されたカラム－ NULL です。たとえば、Year カラムから成るプレフィクスにより生成された小計ローでは、Quarter カラムの値は NULL になります。 • 集合関数－除外されているカラムの値を計算した結果です。小計値は、集計されたローではなく基本データのローに対して計算されます。多くの場合、たとえば SUM や COUNT などでは結果は等しくなりますが、AVG、STDDEV、VARIANCE などの統計関数では結果が異なってくるため、この区別は重要です。 ROLLUP 演算子には次の制限があります。 • ROLLUP 演算子は、COUNT DISTINCT と SUM DISTINCT を除き、GROUP BY 句で使用可能なすべての集合関数をサポートしています。 • ROL
PAGE 68
GROUP BY 句の拡張機能 Large Large Medium Medium Medium One size One size One size One size Small Small fits fits fits fits all all all all (NULL) Sweatshirt (NULL) Shorts Tee Shirt (NULL) Baseball Cap Tee Shirt Visor (NULL) Tee Shirt (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) (NULL) 71 71 134 80 54 263 124 75 64 28 28 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0 1 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 ROLLUP 例 3 次の例は、GROUPING を使用して、最初から格納されていた NULL 値と ROLLUP 操作によって生成された “NULL” 値とを区別する方法を示しています。
PAGE 69
第4章 2001 2001 2001 2001 501 600 601 700 936 936 792 1836 2001 2001 2001 2001 OLAP の使用 501 600 601 700 ROLLUP 例 4 次のクエリ例は、注文数を年別および四半期別に集計したデータを返します。 SELECT year(order_date) AS Year, quarter(order_date) AS Quarter, COUNT(*) AS Orders FROM alt_sales_order GROUP BY ROLLUP(Year, Quarter) ORDER BY Year, Quarter 次の図は、このクエリの結果を示しています。結果セット内の小計ローは強調表示されています。各小計ローでは、その小計の計算対象になったカラムに NULL 値が格納されています。ロー [1] は、両方の年 (2000 年および 2001 年 ) のすべての四半期の注文数の合計を示しています。このローは、Year カラムと Quarter カラムの両方が NULL であり、すべてのカラム
PAGE 70
GROUP BY 句の拡張機能この ROLLUP 操作の例では、年別、四半期別、地域別の注文数を集計するというやや複雑な結果セットを返します。この例では、第 1 および第 2 四半期と 2 つの地域 ( カナダと東部地区 ) だけを分析します。 ROLLUP 例 5 SELECT year(order_date) AS Year, quarter(order_date) AS Quarter, region, COUNT(*) AS Orders FROM alt_sales_order WHERE region IN ('Canada', 'Eastern') AND quarter IN (1, 2) GROUP BY ROLLUP (Year, Quarter, Region) ORDER BY Year, Quarter, Region 次の図は、このクエリの結果セットを示しています。各小計ローでは、その小計の計算対象になったカラムに NULL が格納されています。ロー [1] はすべてのローの集計結果であり、Year、Quarter、Region カラムに NULL が含まれてい
PAGE 71
第4章 OLAP の使用 [3] としてマークされているローは、特定の年および四半期の全地域の注文数の合計を示しています。 [4] としてマークされているローは、結果セット内のそれぞれの年の各四半期の各地域の注文の合計数を示しています。パフォーマンス＆チューニング・ガイド 55
PAGE 72
GROUP BY 句の拡張機能 GROUP BY CUBE GROUP BY 句の CUBE 演算子は、データを複数の次元 ( グループ化の式 ) でグループ化することでデータを分析します。CUBE に次元の順序リストを引数として指定すると、SELECT 文の中で、そのクエリに指定した次元の考えられるすべての組み合わせの小計を計算し、選択した複数のカラムのすべての値の組み合わせについての要約を示す結果セットを生成することができます。 CUBE の構文は次のとおりです。 SELECT … [ GROUPING (column-name) … ] … GROUP BY [ expression [,… ] | CUBE ( expression [,… ] ) ] GROUPING は、カラム名をパラメータとして受け取り、表 4-2 に示すようにブール値を返します。表 4-2: CUBE 演算子が指定された GROUPING によって返される値結果値の種類 GROUPING の戻り値 CUBE 演算子によって作成された NULL 1(真) ローが小計であることを示す NULL 1(真)
PAGE 73
第4章 • OLAP の使用 GROUP BY のキーに定数式を指定することはできません。注意キューブのサイズがテンポラリ・キャッシュのサイズを超えると、CUBE のパフォーマンスが低下します。 GROUPING と CUBE 演算子を併用すると、格納されていた NULL 値と CUBE によって作成されたクエリ結果の “NULL” 値を区別することができます。 GROUPING 関数を使用して結果を分析する方法については、ROLLUP 演算子の説明で紹介した例を参照してください。 CUBE 操作が返す結果セットには、集計カラムを除くすべてのカラムの値が NULL であるローが少なくとも 1 つは含まれています。このローは、集合関数に対する全カラムの要約を表しています。 CUBE 例 1 次の例は、対象者の州 ( 地理的な位置 )、性別、教育レベル、および収入などで構成される調査データを使用したクエリです。最初に紹介するクエリには GROUP BY 句が指定されています。この句は、クエリの結果を census テーブルの state、gender、education カラムの値に応じてロ
PAGE 74
GROUP BY 句の拡張機能 GROUP BY 句の CUBE 拡張機能を使用すると、調査データを 1 回参照するだけで、調査データ全体における州別、性別、教育別の平均収入を計算し、state、 gender、education カラムの考えられるすべての組み合わせにおける平均収入を計算することができます。CUBE 演算子を使用すると、たとえば、すべての州における全女性の平均収入を計算したり、調査対象者全員の平均収入を、各自の教育別および州別に計算したりすることができます。 CUBE でグループを計算するときには、計算されたグループのカラムに NULL 値が挿入されます。最初からデータベース内に格納されていた NULL なのか、 CUBE の結果として生成された NULL なのかを区別するためには、GROUPING 関数を使用する必要があります。GROUPING 関数は、指定されたカラムが上位レベルのグループにマージされている場合は 1 を返します。 CUBE 例 2 次のクエリは、GROUP BY CUBE と GROUPING 関数を併用する方法を示しています。 SELECT case g
PAGE 75
第4章 CA CA CA CA CA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA MA ALL F F M M ALL ALL ALL ALL ALL ALL F F F F F F M M M M M M ALL 200 ALL 200 ALL 100 200 300 400 500 ALL 100 200 300 400 500 ALL 100 200 300 400 500 ALL 3 2 2 1 1 19 11 9 16 9 64 6 3 7 8 4 28 13 8 2 8 5 36 OLAP の使用 52200.00 58650.00 58650.00 39300.00 39300.00 58462.48 50530.73 59500.00 43640.67 33752.20 50064.78 58243.42 60451.00 59685.71 41959.88 29950.00 50146.16 58563.59 46810.63 58850.00 45321.47 36793.96 50001.
PAGE 76
GROUP BY 句の拡張機能次の図は、このクエリの結果セットを示しています。この結果セットでは、小計ローが強調表示されています。各小計ローでは、その小計の計算対象になったカラムに NULL が格納されています。先頭のロー [1] は、両方の年のすべての四半期の注文数の合計を示しています。 Orders カラムの値は、[3] としてマークされている各ローの値の合計です。これは、[2] としてマークされている 4 つのローの値の合計でもあります。 [2] としてマークされている一連のローは、両方の年の四半期別の注文数の合計を示しています。[3] としてマークされている 2 つのローは、それぞれ 2000 年および 2001 年のすべての四半期の注文数の合計を示しています。 60 Sybase IQ
PAGE 77
第4章 OLAP の使用統計関数 Sybase IQ では、1 つの SQL 文内で複雑なデータ分析を実行できる機能を備えた単純な集合関数とウィンドウ集合関数の両方を提供しています。これらの関数を使用して、たとえば “ ダウ工業株 30 種平均の四半期の移動平均はどうなっているか ” または “ 各部署のすべての従業員とその累積給与を一覧表示せよ ” というクエリに対する答えを計算することができます。さまざまな期間における移動平均と累積和を計算したり、パーティション値が変化したときに集合計算がリセットされるような方法で集計とランクを分割したりできます。1 つのクエリ式のスコープ内で、それぞれ独自のパーティショニング・ルールを持ついくつかの異なる OLAP 関数を定義することができます。統計関数は 2 つのカテゴリに分けられます。 • 単純な集合関数 (AVG、COUNT、MAX、MIN、SUM など ) は、データベースに含まれるローのグループのデータを要約します。SELECT 文の GROUP BY 句を使ってグループを形成します。 • 1 つの引数を取る単項の統計集合
PAGE 78
統計関数ウィンドウ OLAP に関する ANSI SQL 拡張機能で導入された主な機能は、ウィンドウと呼ぶ構造です。このウィンドウ拡張機能により、ユーザはクエリの結果セット ( または、クエリの論理パーティション ) をパーティションと呼ばれるローのグループに分割し、現在のローについて集計するローのサブセットを決定することができます。 1 つのウィンドウには 3 つのクラスのウィンドウ関数として、ランク付け関数、ロー・ナンバリング関数、およびウィンドウ集合関数を使用できます。 ::= | ROW_NUMBER | 詳細については、「文法規則 6」(98 ページ ) を参照してください。ウィンドウ拡張機能は、ウィンドウ名または指定に対するウィンドウ関数の種類を指定し、1 つのクエリ式のスコープ内のパーティション化された結果セッ
PAGE 79
第4章 OLAP の使用 OLAP のウィンドウ指定に関して名前を指定することができます。冗長なウィンドウ定義を避けるために、この名前を使用して複数のウィンドウ関数を指定できます。その場合は、キーワード WINDOW の後に少なくとも 1 つのウィンドウ定義を指定します ( 複数指定する場合はカンマで区切ります )。ウィンドウ定義には、クエリ内でウィンドウを識別するための名前と、ウィンドウのパーティション、順序、フレームを定義するためのウィンドウ指定の詳細を含めます。 ::= ::= [ { } . . .
PAGE 80
統計関数ウィンドウ・パーティションウィンドウ・パーティションとは、PARTITION BY 句を使用して、ユーザ指定の結果セット ( 入力ロー ) を分割することです。パーティションは、カンマで区切られた 1 つ以上の値の式によって定義されます。パーティションに分割されたデータは暗黙的にソートされ、デフォルトのソート順序は昇順 (ASC) になります。 ::= PARTITION BY ウィンドウ・パーティション句を指定しなかった場合は、入力が 1 つのパーティションとして扱われます。注意統計関数に対してパーティションという用語を使用した場合は、結果セットのローを PARTITION BY 句に基づいて分割することだけを意味します。ウィンドウ・パーティションは任意の式に基づいて定義できます。また、ウィンドウ・パーティションの処理はグループ化の後に行われるので (GROUP BY 句が指定されている場合 )、SUM、AVG、VARIANCE などの集合関数の結果
PAGE 81
第4章 OLAP の使用 OLAP のランク付け関数には順序の指定が必須であり、ランキング値の基準は、ランク付け関数の引数ではなく ORDER BY 句で指定します。OLAP の集合関数では、通常は ORDER BY 句の指定は必須ではありませんが、ウィンドウ・フレームを定義するときには必須とされています (「ウィンドウ・フレーム」 (65 ページ ) を参照してください )。これは、各フレームの適切な集合値を計算する前に、パーティション内のローをソートしなければならないためです。この ORDER BY 句には、昇順および降順のソートを定義するためのセマンティックと、NULL 値の取り扱いに関する規則を指定します。OLAP 関数は、デフォルトでは昇順 (最も小さい値が 1 番目にランク付けされる) を使用します。これは SELECT 文の最後に指定する ORDER BY 句のデフォルト動作と同じですが、連続的な計算を行う場合にはわかりにくいかもしれません。OLAP の計算では、降順 ( 最も大きい値が 1 番目にランク付けされる ) でのソートが必要になることがよくあります。この要件
PAGE 82
統計関数図 4-3: 分割された入力と、3 ロー分の移動ウィンドウ UNBOUNDED PRECEEDING と FOLLOWING ウィンドウ・フレームは、パーティションの先頭 (UNBOUNDED PRECEDING)、最後 (UNBOUNDED FOLLOWING)、または両方まで到達する無制限の集合グループによって定義されます。 UNBOUNDED PRECEDING には、パーティション内の現在のロー以前にあるすべてのローが含まれており、ROWS または RANGE で指定できます。UNBOUNDED FOLLOWING には、パーティション内の現在のロー以後にあるすべてのローが含まれており、ROWS または RANGE で指定できます。詳細については、「ROWS」 (67 ページ ) と「RANGE」(70 ページ ) を参照してください。 FOLLOWING の値では、現在のロー以降にあるローの範囲または数を指定します。ROWS を指定する場合、その値には、ローの数を表す正の数を指定します。RANGE を指定する場合、そのウィンドウには、現在のローに指定の数値を足した数
PAGE 83
第4章 OLAP の使用 BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING の組み合わせを使用すると、グループ化したクエリとのジョインを構築しなくても、パーティション全体についての集合を計算できます。パーティション全体についての集合は、レポート集合とも呼ばれます。 CURRENT ROW の概念物理的な集合グループでは、現在のローに対する相対位置に基づき、隣接するローの数に応じて、ローを含めるか除外するかが判断されます。現在のローは、クエリの中間結果における次のローへの参照にすぎません。現在のローが前に進むと、ウィンドウ内に含まれる新しいロー・セットに基づいてウィンドウが再評価されます。現在のローをウィンドウ内に含めるという要件はありません。ウィンドウ・フレーム句を指定しなかった場合のデフォルトのウィンドウ・フレームは、ウィンドウ順序句を指定しているかどうかによって異なります。 • ウィンドウ指定にウィンドウ順序句が含まれている場合は、ウィンドウの開始ポイントは UNBOUNDED PRECEDING、終了ポイントは CUR
PAGE 84
統計関数どのウィンドウ・フレームでも、現在のローが参照ポイントになります。 SQL/OLAP の構文には、ローベースのウィンドウ・フレームを、現在のローの前または後にある任意の数のロー ( あるいは現在のローの前および後ろにある任意の数のロー ) として定義するためのメカニズムが用意されています。ウィンドウ・フレーム単位の代表的な例を次に示します。 • Rows Between Unbounded Preceding and Current Row －各パーティションの先頭を開始ポイントとし、現在のローを終了ポイントとするウィンドウを指定します。累積和など、累積的な結果を計算するためのウィンドウを構築するときによく使用されます。 • Rows Between Unbounded Preceding and Unbounded Following －現在のローに関係なく、パーティション全体についての固定ウィンドウを指定します。そのため、ウィンドウ集合関数の値は、パーティションのすべてのローで等しくなります。 • Rows Between 1 Preceding and 1 F
PAGE 85
第4章 OLAP の使用ローベースのウィンドウ・フレーム図 4-4 の例では、ロー [1] ～ [5] は 1 つのパーティションを表しています。それぞれのローは、OLAP のウィンドウ・フレームが前にスライドするにつれて現在のローになります。このウィンドウ・フレームは Between Current Row And 2 Following として定義されているため、各フレームには、最大で 3 つ、最小で 1 つのローが含まれます。フレームがパーティションの終わりに到達したときは、現在のローだけがフレームに含まれます。網掛けの部分は、図 4-4 の各ステップでフレームから除外されているローを表しています。図 4-4: ローベースのウィンドウ・フレーム図 4-4 のウィンドウ・フレームは、次のような規則で機能しています。 • ロー [1] が現在のローであるときは、ロー [4] および [5] が除外される。 • ロー [2] が現在のローであるときは、ロー [5] および [1] が除外される。 • ロー [3] が現在のローであるときは、ロー [1] および [2]
PAGE 86
統計関数平均値は次のようにして計算されています。 • ロー [1] = (10 + 50 + 100)/3 • ロー [2] = (50+ 100 + 120)/3 • ロー [3] = (100 + 120 + 500)/3 • ロー [4] = (120 + 500 + NULL)/3 • ロー [5] = (500 + NULL + NULL)/3 結果セット内の以降のすべてのパーティション ( たとえば B、C など ) についても、同様の計算が実行されます。現在のウィンドウにローが含まれていない場合、COUNT 以外のケースでは、結果は NULL になります。 RANGE 範囲ベースのウィンドウ・フレーム前述のローベースのウィンドウ・フレームの例では、さまざまなローベースのウィンドウ・フレーム定義の中から 1 つを紹介しました。SQL/OLAP 構文では、また別の種類のウィンドウ・フレームとして、物理的なローのシーケンスではなく、値ベース ( または範囲ベース ) のロー・セットに基づいて境界を定義する方法が用意されています。値ベースのウィンドウ・フレーム
PAGE 87
第4章 OLAP の使用このような範囲指定は内包的です。現在のローの year 値が 2000 である場合は、ウィンドウ・パーティション内で、year 値が 2000 および 1999 であるすべてのローがこのフレームに含まれることになります。パーティション内での各ローの物理的な位置は問われません。値ベースのフレームでは、ローを含めたり除外したりする規則が、ローベースのフレームの規則とは大きく異なります ( ローベースのフレームの規則は、ローの物理的なシーケンスに完全に依存しています )。 OLAP の AVG() 関数の例で考えてみます。次の部分的な結果セットは、値ベースのウィンドウ・フレームの概念を具体的に表しています。前述のように、このフレームには次のローが含まれます。 • 現在のローと同じ year 値を持つロー • 現在のローから 1 を減算したのと同じ year 値を持つロー次のクエリは、範囲ベースのウィンドウ・フレーム定義の例を示しています。 SELECT dimension, year, measure, AVG(measure) OVER(PARTITION B
PAGE 88
統計関数 n FOLLOWING の指定には、次のような意味があります。 • パーティションがデフォルトの昇順 (ASC) でソートされている場合は、n は正の値として解釈されます。 • パーティションが降順 (DESC) でソートされている場合は、n は負の値として解釈されます。たとえば、year カラムに 1999 ～ 2002 の 4 種類の値が含まれているとします。次のテーブルは、これらの値をデフォルトの昇順でソートした場合 ( 左側 ) と降順でソートした場合 ( 右側 ) を示しています。現在のローが 1999 で、フレームが次のように指定されている場合、このフレームには値 1999 のローと値 1998 のロー ( このテーブルには存在しません ) が含まれます。 ORDER BY year ASC range BETWEEN CURRENT ROW and 1 FOLLOWING 注意 ORDER BY 値のソート順序は、値ベースのフレームに含まれるローの条件をテストするときに重要な要素です。フレームに含まれるか除外されるかは、数値だけでは決まりません。無制限ウ
PAGE 89
第4章 OLAP の使用このクエリの結果セットを次に示します。 emp_id -----102 105 160 243 247 249 266 278 316 445 453 479 501 529 582 604 839 1157 1250 emp_lname --------Whitney Cobb Breault Shishov Driscoll Guevara Gowda Melkisetian Pastor Lull Rabkin Siperstein Scott Sullivan Samuels Wang Marshall Soo Diaz curr --------45700.000 62000.000 57490.000 72995.000 48023.690 42998.000 59840.000 48500.000 74500.000 87900.000 64500.000 39875.500 96300.000 67890.000 37400.000 68400.000 42500.000 39075.000 54900.000 prev ---------64500.
PAGE 90
統計関数 • インラインのウィンドウ指定。クエリ式の SELECT リスト内でウィンドウを定義します。これにより、HAVING 句の後のウィンドウ句でウィンドウを定義し、それをウィンドウ関数呼び出しから名前で参照するという方法に加えて、関数呼び出しと一緒にウィンドウを定義するという方法が可能になります。注意インラインのウィンドウ指定を使用する場合は、ウィンドウの名前を指定できません。1 つの SELECT リスト内で複数のウィンドウ関数呼び出しが同じウィンドウを使用する場合には、ウィンドウ句で定義した名前付きウィンドウを参照するか、インラインのウィンドウ定義を繰り返す必要があります。ウィンドウ関数の例ウィンドウ関数の例を次に示します。このクエリでは、データを部署別のパーティションに分け、在社年数が最も長い従業員を基点とした従業員の累積給与を計算して、結果セットを返します。この結果セットには、マサチューセッツ在住の従業員だけが含まれます。Sum_Salary カラムには、従業員の給与の累積和が含まれます。 SELECT dept_id, emp_lname, start_d
PAGE 91
第4章 200 200 200 200 200 200 200 200 200 200 200 Dill Powell Poitras Singer Kelly Martel Sterling Chao Preston Goggin Pickett 1985-12-06 1988-10-14 1988-11-28 1989-06-01 1989-10-01 1989-10-16 1990-04-29 1990-05-13 1990-07-11 1990-08-05 1993-08-12 54800.000 54600.000 46200.000 34892.000 87500.000 55700.000 64900.000 33890.000 37803.000 37900.000 47653.000 OLAP の使用 54800.000 109400.000 155600.000 190492.000 277992.000 333692.000 398592.000 432482.000 470285.000 508185.000 555838.
PAGE 92
統計関数これは次の指定に相当します。 ( COUNT (*) OVER ( ws RANGE UNBOUNDED PRECEDING ) - COUNT (*) OVER ( ws RANGE CURRENT ROW ) + 1 ) この RANK 関数の変換では、論理的な集合 (RANGE) を使用しています。この結果、同位のロー ( 順序付けカラムに同じ値が含まれているロー ) が複数ある場合は、それらに同じランクが割り当てられます。パーティション内で異なる値を持つ次のグループには、同位のローのランクよりも 1 以上大きいランクが割り当てられます。たとえば、順序付けカラムに 10、20、20、20、30 という値を含むローがある場合、1 つ目のローのランクは 1 になり、2 つ目のローのランクは 2 になります。3 つ目と 4 つ目のローのランクも 2 になりますが、5 つ目のローのランクは 5 になります。ランクが 3 または 4 のローは存在しません。このアルゴリズムは非連続型ランキング (sparse ranking) とも呼ばれます。『Sybase IQ リファレンス・マニ
PAGE 93
第4章 OLAP の使用 PERCENT_RANK() 関数 PERCENT_RANK 関数は、個別の順位ではなく、パーセンテージでのランクを計算して、0 ～ 1 の小数値を返します。つまり、PERCENT_RANK が返すのはローの相対的なランクであり、この数値は、該当するウィンドウ・パーティション内での現在のローの相対位置を表します。たとえば、順序付けカラムの値がそれぞれ異なる 10 個のローがパーティションに含まれている場合、このパーティションの 3 つ目のローに対する PERCENT_RANK の値は 0.222 ... となります。パーティションの 1 つ目のローに続く 2/9 (22.222...
PAGE 94
統計関数 Gowda Breault Diaz Melkisetian Driscoll Whitney Guevara Marshall Siperstein Soo Samuels 59840.000 57490.000 54900.000 48500.000 48023.690 45700.000 42998.000 42500.000 39875.500 39075.000 37400.
PAGE 95
第4章 Samuels Singer Chao 37400.000 34892.000 33890.000 M M M OLAP の使用 19 20 21 ランク付けの例 3 この例では、カリフォルニアおよびテキサスの女性従業員を取得し、給与を基準として降順にランク付けしています。累積和を降順で示すために、PERCENT_RANK 関数を使用しています。 SELECT emp_lname, salary, sex, CAST(PERCENT_RANK() OVER (ORDER BY salary DESC) AS numeric (4, 2)) AS RANK FROM employee WHERE state IN ('CA', 'TX') AND sex ='F' ORDER BY salary DESC; このクエリの結果セットを次に示します。 emp_lname --------Savarino Smith Clark Garcia salary --------72300.000 51411.000 45000.000 39800.
PAGE 96
統計関数ウィンドウ集合関数ウィンドウ集合関数を使用すると、複数のレベルの集合を 1 つのクエリで計算できます。たとえば、支出が平均より少ない四半期をすべて列挙することができます。集合関数 (単純な集合関数 AVG、COUNT、MAX、MIN、SUM を含む ) を使用すると、1 つの文の中でさまざまなレベルで計算した結果を 1 つのローに書き出すことができます。これにより、ジョインや相関サブクエリを使用しなくても、集合値をグループ内のディテール・ローと比較することができます。これらの関数を使用して、非集合値と集合値を比較することも可能です。たとえば、営業部員が特定の年にある製品に対して平均以上の注文を出した顧客の一覧を作成したり、販売マネージャが従業員の給与をその部署の平均給与と比較したりすることが考えられます。 SELECT 文の中で DISTINCT が指定されている場合は、ウィンドウ演算子の後に DISTINCT 操作が適用されます ( ウィンドウ演算子は、GROUP BY 句が処理された後、SELECT リストの項目やクエリの ORDER BY 句が評価される前に計算されま
PAGE 97
第4章 OLAP の使用ウィンドウ集合関数の例 2 この例のクエリは、給与の額がそれぞれの部署の平均給与よりも 1 標準偏差以上高い従業員を表す結果セットを返します。標準偏差とは、そのデータが平均からどのぐらい離れているかを示す尺度です。 SELECT * FROM (SELECT emp_lname AS E_name, dept_id AS Dept, CAST(salary AS numeric(10,2) ) AS Sal, CAST(AVG(Sal) OVER(PARTITION BY dept_id) AS numeric(10, 2)) AS Average, CAST(STDDEV_POP(Sal) OVER(PARTITION BY dept_id) AS numeric(10,2)) AS STD_DEV FROM employee GROUP BY Dept, E_name, Sal) AS derived_table WHERE Sal> (Average+STD_DEV ) ORDER BY Dept, Sal, E_name; このクエリの結果セットを次に示します。どの
PAGE 98
統計関数 • STDDEV_POP －グループまたはパーティションの各ロー (DISTINCT が指定されている場合は、重複が削除された後に残る各ロー ) に対して評価される「値の式」についての母標準偏差を計算します。これは、母分散の平方根として定義されます。 • STDDEV_SAMP －グループまたはパーティションの各ロー (DISTINCT が指定されている場合は、重複が削除された後に残る各ロー ) に対して評価される「値の式」についての母標準偏差を計算します。これは、標本分散の平方根として定義されます。 • VAR_POP －グループまたはパーティションの各ロー (DISTINCT が指定されている場合は、重複が削除された後に残る各ロー ) に対して評価される「値の式」についての母分散を計算します。これは、「値の式」と「値の式の平均」との差の 2 乗和をグループまたはパーティション内の残りのローの数で割った値として定義されます。 • VAR_SAMP －グループまたはパーティションの各ロー (DISTINCT が指定されている場合は、重複が削除された後に残
PAGE 99
第4章 OLAP の使用逆分散統計関数では、WITHIN GROUP (ORDER BY) 句を指定する必要があります。次に例を示します。 PERCENTILE_CONT ( expression1 ) WITHIN GROUP ( ORDER BY expression2 [ ASC | DESC ] ) expression1 の値には、numeric データ型の定数を、0 以上 1 以下の範囲で指定します。引数が NULL であれば、“wrong argument for percentile” エラーが返ります。引数の値が 0 よりも小さいか、1 よりも大きい場合は、“data value out of range” エラーが返ります。必須の ORDER BY には、パーセンタイル関数の実行の対象となる式と、各グループ内でのローのソート順を指定します。この ORDER BY 句は、WITHIN GROUP 句の内部でのみ使用するものであり、SELECT 文の ORDER BY とは異なります。 WITHIN GROUP 句は、クエリの結果を並べ替えて、関数が結果を計算するためのデ
PAGE 100
統計関数次のクエリ例では、SELECT 文に PERCENTILE_CONT 関数を含めています。 SELECT region, PERCENTILE_CONT(0.
PAGE 101
第4章 OLAP の使用分散統計関数の詳細については、『Sybase IQ リファレンス・マニュアル』の「第 5 章 SQL 関数」の「PERCENTILE_CONT 関数 [ 統計 ]」と「PERCENTILE_DISC 関数 [ 統計 ]」を参照してください。数値関数 Sybase IQ でサポートされる OLAP 数値関数には、 CEILING ( エイリアスは CEIL)、 EXP ( エイリアスは EXPONENTIAL)、FLOOR、LN ( エイリアスは LOG)、SQRT、 WIDTH_BUCKET があります。 :: = | | | | | | サポートされる数値関数の構文を表 4-3 に示します。表 4-3: 数値関数の構文数値関数自然対数構文 LENG
PAGE 102
統計関数 WIDTH_BUCKET 関数 • FLOOR: 引数の値以下で、正の無限大に最も近い整数値を返します。 • CEILING: 引数の値以上で、負の無限大に最も近い整数値を返します。CEIL は CEILING の同意語です。 WIDTH_BUCKET 関数は、他の数値関数よりも少し複雑です。この関数は 4 つの引数を取ります。具体的には、「目的の値」、2 つの範囲境界、そしてこの範囲を何個の等しいサイズ ( または可能な限り等しいサイズ ) の「バケット」に分割するかを指定します。WIDTH_BUCKET 関数は、範囲の上限から下限までの差のパーセンテージに基づき、目的の値が何番目のバケットに含まれるかを示す数値を返します。最初のバケットが、バケット番号 1 となります。目的の値が範囲境界の外にある場合のエラーを避けるために、範囲の下限よりも小さい目的の値は、先頭の補助バケット ( バケット 0) に配置されます。同様に、範囲の上限よりも大きい目的の値は、末尾の補助バケット ( バケット N+1) に配置されます。たとえば、WIDTH_BUCKET (14, 5,
PAGE 103
第4章 OLAP の使用注意これは説明用の例であり、asiqdemo データベースから生成したものではありません。 SELECT customer_id, cust_last_name, credit_limit, WIDTH_BUCKET(credit_limit, 100, 5000, 10) "Credit Group" FROM customers WHERE territory = 'MA' ORDER BY "Credit Group"; CUSTOMER_ID ----------825 826 853 827 843 844 835 840 842 841 837 836 848 849 828 829 852 851 850 830 831 832 838 839 833 834 845 846 847 CUST_LAST_NAME -------------Dreyfuss Barkin Palin Siegel Oates Julius Eastwood Elliott Stern Boyer Stanton Berenger Olmos Kaurusmdki Minnel
PAGE 104
OLAP の規則と制限参照『Sybase IQ リファレンス・マニュアル』の「第 5 章 SQL 関数」の「BIT_LENGTH 関数 [ 文字列 ]」、「EXP 関数 [ 数値 ]」、「FLOOR 関数 [ 数値 ]」、「POWER 関数 [ 数値 ]」、「SQRT 関数 [ 数値 ]」、「WIDTH_BUCKET 関数 [ 数値 ]」を参照してください。 OLAP の規則と制限 OLAP 関数を使用できる場合 OLAP 関数を使用できない場合 SQL クエリ内では、次の条件下で OLAP 関数を使用できます。 • SELECT リストの中 • 式の中 • スカラ関数の引数として • 最後の ORDER BY 句の中 ( クエリ内のどこかで定義されている OLAP 関数のエイリアスまたは位置参照を使用 ) OLAP 関数は、次の条件下では使用できません。 • サブクエリの中 • WHERE 句の検索条件の中 • SUM ( 集合 ) 関数の引数としてたとえば次の式は無効です。 SUM(RANK() OVER(ORDER BY dollars)) •
PAGE 105
第4章 Sybase IQ の制限事項 OLAP の使用 Sybase IQ で SQL OLAP 関数を使用するときの制限事項を次に示します。 • ウィンドウ・フレーム定義の中でユーザ定義関数を使用することはできません。 • ウィンドウ・フレーム定義で使用する定数は符号なし数値でなければならず、最大値 BIG INT 263-1 を超えてはなりません。 • ウィンドウ集合関数と RANK 関数は、DELETE および UPDATE 文では使用できません。 • ウィンドウ集合関数と RANK 関数は、サブクエリ内では使用できません。 • CUME_DIST は、現時点ではサポートされていません。 • グループ化セットは、現時点ではサポートされていません。 • 相関関数と直線回帰関数は、現時点ではサポートされていません。その他の OLAP の例この項では、OLAP 関数を使用したその他の例を紹介します。ウィンドウの開始ポイントと終了ポイントは、中間の結果ローが処理されるときに変化する可能性があります。たとえば、累積和を計算する場合には、ウィンドウの開始ポイントは
PAGE 106
その他の OLAP の例このクエリの結果セットを次に示します。 ID --302 400 400 401 401 401 500 501 501 501 501 601 700 700 description quantity -----------------Crew Neck 60 Cotton Cap 60 Cotton Cap 48 Wool cap 48 Wool cap 60 Wool cap 48 Cloth Visor 48 Plastic Visor 60 Plastic Visor 48 Plastic Visor 48 Plastic Visor 60 Zipped Sweatshirt 60 Cotton Shorts 72 Cotton Shorts 48 ship_date --------2001-07-02 2001-05-26 2001-07-05 2001-06-02 2001-06-30 2001-07-09 2001-06-21 2001-05-03 2001-05-18 2001-05-25 2001-07-07 2001-07-19 2001-05-18 2
PAGE 107
第4章 OLAP の使用このクエリ指定では、ウィンドウ句が ORDER BY 句の前にあることに注意してください。ウィンドウ句を使用するときには、次の制限が適用されます。 • インラインのウィンドウ指定に PARTITION BY 句を含めることはできません。 • ウィンドウ句で指定されるウィンドウにウィンドウ・フレーム句を含めることはできません。たとえば、「文法規則 32」(100 ページ ) に次のように記述されています。 ::= • インラインのウィンドウ指定にもウィンドウ句のウィンドウ指定にもウィンドウ順序句を含めることができますが、両方に含めることはできません。たとえば、「文法規則 31」(100 ページ ) に次のように記述されています。 ::= 例：複数の関数で使用されるウィンドウ 1 つの名前付きウィンドウを定義しておき、そのウィンドウに基づい
PAGE 108
その他の OLAP の例例：累積和の計算このクエリでは、ORDER BY start_date の順序に従って、部署別の給与の累積和を計算します。 SELECT dept_id, start_date, name, salary, SUM(salary) OVER (PARTITION BY dept_id ORDER BY start_date ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) FROM emp1 ORDER BY dept_id, start_date; このクエリの結果セットを次に示します。 dept_id ------100 100 100 100 100 100 200 200 200 200 300 300 300 start_date ---------1996-01-01 1997-01-01 1998-01-01 1998-02-01 1998-03-12 1998-12-01 1998-01-01 1998-01-20 1998-02-01 1999-01-10 1998-03-12 1998-12-01 199
PAGE 109
第4章 10 20 20 20 20 20 20 30 30 30 30 6 1 2 3 4 5 6 1 2 3 4 110 20 30 25 30 31 20 10 11 12 1 OLAP の使用 120.00 20.00 25.00 25.00 28.33 28.66 27.00 10.00 10.50 11.00 8.
PAGE 110
その他の OLAP の例例：1 つのクエリ内で複数の集合関数を使用この例では、1 つのクエリ内で、異なるウィンドウに対して 2 種類の集合関数を実行しています。 SELECT prod_id, month_num, sales, AVG(sales) OVER (WS1 ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) AS CAvg, SUM(sales) OVER(WS1 ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) AS CSum FROM sale WHERE rep_id = 1 WINDOW WS1 AS (PARTITION BY prod_id ORDER BY month_num) ORDER BY prod_id, month_num; このクエリの結果セットを次に示します。 prod_id ------10 10 10 10 10 10 20 20 20 20 20 20 30 30 30 30 month_num --------1 2 3 4 5 6 1 2 3 4 5 6 1 2 3
PAGE 111
第4章 10 10 10 10 10 10 10 20 20 20 20 20 20 30 30 30 30 30 1 2 3 4 5 5 6 1 2 3 4 5 6 1 2 3 4 4 150 120 100 130 120 31 110 20 30 25 30 31 20 10 11 12 1 1 250 370 470 350 381 381 391 20 50 75 85 86 81 10 21 33 25 25 OLAP の使用 250 370 370 350 350 281 261 20 50 75 85 86 81 10 21 33 24 14 例：現在のローを除外するウィンドウ・フレームこの例では、現在のローを除外するウィンドウ・フレームを定義しています。このクエリは、現在のローを除く 4 つのローの合計を計算します。 SELECT prod_id, month_num, sales, sum(sales) OVER (PARTITION BY prod_id ORDER BY month_num RANGE BETWEEN 6 PRECEDING AND 2 PRECED
PAGE 112
その他の OLAP の例例：ROW のデフォルトのウィンドウ・フレームこのクエリは、ROW のデフォルトのウィンドウ・フレームの例を示しています。 SELECT prod_id, month_num, sales, SUM(sales) OVER (PARTITION BY prod_id ORDER BY month_num RANGE BETWEEN 1 FOLLOWING AND 3 FOLLOWING) FROM sale ORDER BY prod_id, month_num; このクエリの結果セットを次に示します。 prod_id ------10 10 10 10 10 10 10 10 20 20 20 20 20 20 30 30 30 30 30 month_num --------1 1 2 3 4 5 5 6 1 2 3 4 5 6 1 2 3 4 4 sales ----100 150 120 100 130 120 31 110 20 30 25 30 31 20 10 11 12 1 1 sum(sales) ---------350 350 381 391 261
PAGE 113
第4章 10 10 20 20 20 20 20 20 30 30 30 30 5 6 1 2 3 4 5 6 1 2 3 4 120 110 20 30 25 30 31 20 10 11 12 1 OLAP の使用 680 680 156 156 156 156 156 156 34 34 34 34 このクエリは、次のクエリと同じ意味になります。 SELECT prod_id, month_num, sales, SUM(sales) OVER (PARTITION BY prod_id ) FROM sale WHERE rep_id = 1 ORDER BY prod_id, month_num; 例： RANGE のデフォルトのウィンドウ・フレームこのクエリは、RANGE のデフォルトのウィンドウ・フレームの例を示しています。 SELECT prod_id, month_num, sales, SUM(sales) OVER (PARTITION BY prod_id ORDER BY month_num) FROM sale ORDER BY prod_id, month_nu
PAGE 114
OLAP 関数の BNF 文法 30 30 4 4 1 1 35 35 このクエリは、次のクエリと同じ意味になります。 SELECT prod_id, month_num, sales, SUM(sales) OVER (PARTITION BY prod_id ORDER BY month_num RANGE BETWEEEN UNBOUNDED PRECEDING AND CURRENT ROW) FROM sale ORDER BY prod_id, month_num; OLAP 関数の BNF 文法次の BNF (Backus-Naur Form ) 文法は、さまざまな ANSI SQL 統計関数に関する具体的な構文サポートの概要を示しています。ここに記載されている関数の多くは Sybase IQ で実装されています。文法規則 1