テストとプロトタイプ作成用の公開されているデータ セット
- [アーティクル]
-
-
適用対象: Azure SQL データベース Azure SQL Managed Instance Azure VM 上の SQL Server
ストレージ サービスおよびソリューションと分析サービスおよびソリューションのプロトタイプ作成とテストに使用できるデータについては、この公開されているデータ セットの一覧を参照してください。
米国政府と企業のデータ
データ ソース |
データについて |
ファイルについて |
米国政府データ |
米国の農業、気候、コンシューマー、エコシステム、教育、エネルギー、金融、医療、地方自治体、製造業、海運、海洋、公安、科学調査を対象とする 250,000 件を越えるデータ セット。 |
HTML、XML、CSV、JSON、Excel、などの各種形式のさまざまなサイズのファイル。 使用可能なデータ セットをファイル形式でフィルター処理できます。 |
米国国勢調査データ |
米国の人口統計データです。 |
データ セットはさまざまな形式で提供されます。 |
NASA の地球科学データ |
農業、大気、生物圏、気候、雪氷圏、人的事象、水圏、地表、海洋、太陽と地球の相互作用などを対象とする 32,000 件を越えるデータ セット。 |
データ セットはさまざまな形式で提供されます。 |
航空会社のフライト遅延データとその他の輸送データ |
"米国運輸省 (DOT) の運輸統計局 (BTS) では、大手航空会社が運航している国内フライトの定刻実績を追跡しています。 定時便、遅延便、欠航便、迂回便の数に関する概要情報が ... この Web サイトに掲載されている集計表に表示されます。" |
ファイルは CSV 形式で提供されます。 |
交通事故による死亡者数 - Fatality Analysis Reporting System (FARS) |
"FARS とは、NHTSA、議会、米国国民に、自動車による交通事故で負った致命傷に関する年次データを提供する全国的な調査です。" |
"FARS 照会システムを使用して、死亡事故に関する独自のデータを作成し、オンラインで実行できます。 また、1975 年から現在までのすべての FARS データを FTP サイトからダウンロードすることもできます。" |
有毒化学物質データ - EPA Toxicity ForeCaster (ToxCast™) データ |
"何千種類もの化学物質に関する、EPA の最新の毒性データです。このデータは公開されており、高スループットで提供されます。 このデータは、EPA の ToxCast 調査を元に生成されました。" |
データ セットは、スプレッドシート、R パッケージ、MySQL データベース ファイルなど、さまざまな形式で利用できます。 |
NCBI のバイオ テクノロジとゲノムのデータ |
遺伝子、ゲノム、たんぱく質を対象とする複数のデータ セットです。 |
データ セットは、テキスト、XML、BLAST などの形式で提供されます。 BLAST アプリが使用できます。 |
その他の統計データと科学的データ
オンライン サービス データ
データ ソース |
データについて |
ファイルについて |
GitHub Archive |
"GitHub Archive は、公開されている GitHub の (イベントの) タイムラインを記録してアーカイブし、今後の分析で簡単にアクセスできるようにするためのプロジェクトです。" |
JSON でエンコードされたイベント アーカイブを、Web クライアントから .gz (Gzip) 形式でダウンロードします。 |
Stack Overflow データ ダンプ |
"これは、Stack Overflow を含む Stack Exchange ネットワーク上でユーザーが投稿したすべてのコンテンツの匿名化されたダンプです。" |
"Stack Overflow などの各サイトは、bzip2 圧縮を使用する 7-zip で圧縮した XML ファイルで構成された、個別のアーカイブとしてフォーマットされます。 各サイトのアーカイブには、Posts、Users、Votes、Comments、PostHistory、PostLinks が含まれます。" |