Docs Menu
Docs Home
/
MongoDB Atlas
/ /

訓練用サンプル データセット

項目一覧

  • コレクション
  • sample_training.companies
  • sample_training.grades
  • sample_training.inspections
  • sample_airbnb.listingsAndReviews
  • sample_training.routes
  • sample_training.trips
  • sample_training.zips

sample_trainingデータベースには、 MongoDB プライベート 訓練提供で使用される実際のデータのセットが含まれています。 このデータセットは、次のような公開利用可能なデータソースに基づいています。

これらの実際のデータセットは、プライベート 訓練ラボや訓練全体で MongoDB の機能を調べるために使用されています。

Atlas が提供するサンプルデータをクラスターにロードする方法について学ぶには、サンプルデータのロード」を参照してください。

sample_trainingデータベースには次のコレクションが含まれています。

コレクション名
説明

Crucbase Data のリストが含まれています 会社情報。

さまざまな評価のスコアを含む、特定のクラスに関する学生成績情報が含まれています。

ビジネスが失敗したか検査に合格したかを含む、ニューヨーク市のビジネス検査のリストが含まれています。

ランダムに生成されたコメントを持つブログ記事として整理された、ランダム化された米国セカンダリの選挙メッセージが含まれます。

航空会社のルート、ソースと目的地フィールド、サービス航空会社、プレーンのタイプに関する情報が含まれています。 このコレクションは、 $graphLookup集計ステージを調査するラボで使用されます。

ニューヨーク市 のコレクション データ が含まれています データをトリップします。このデータは、 $graphLookup集計ステージを調べて、地理空間クエリを紹介するのに役立ちます。

米国の一般都市の郵便番号データが含まれています。

このコレクションには、Clusterbase にリストされている会社に関する情報が含まれています。 これには、会社、プロジェクト、会社に関連する既知の個人に関する会社のウェブサイトやブログ ウェブサイトなど、さまざまな情報があります。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "52cdef7c4bab8bd675298291"
},
"acquisition": null,
"acquisitions": [],
"alias_list": null,
"blog_feed_url": "http://mobiance.wordpress.com/feed/",
"blog_url": "http://mobiance.wordpress.com/",
"category_code": "web",
"competitions": [],
"created_at": "Tue Feb 12 17:31:58 UTC 2008",
"crunchbase_url": "http://www.crunchbase.com/company/mobiance",
"deadpooled_day": null,
"deadpooled_month": null,
"deadpooled_url": null,
"deadpooled_year": null,
"description": null,
"email_address": "info@mobiance.com",
"external_links": [],
"founded_day": {
"$numberInt": "1"
},
"founded_month": {
"$numberInt": "10"
},
"founded_year": {
"$numberInt": "2004"
},
"funding_rounds": [],
"homepage_url": "http://www.mobiance.com",
"image": {
"attribution": null,
"available_sizes": [
[
[
{
"$numberInt": "150"
},
{
"$numberInt": "43"
}
],
"assets/images/resized/0001/1859/11859v1-max-150x150.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-250x250.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-450x450.png"
]
]
},
"investments": [],
"ipo": null,
"milestones": [],
"name": "Mobiance",
"number_of_employees": {
"$numberInt": "5"
},
"offices": [
{
"address1": "BC-3, Atrium Business Center,",
"address2": "Coles Road, Frazer Town,",
"city": "Bangalore",
"country_code": "IND",
"description": null,
"latitude": null,
"longitude": null,
"state_code": null,
"zip_code": "560005"
}
],
"overview": "<p>Mobiance provides the technology to track cell phones ...",
"partners": [],
"permalink": "mobiance",
"phone_number": "+91-80- 41264756",
"products": [],
"providerships": [],
"relationships": [
{
"is_past": true,
"person": {
"first_name": "Ritesh",
"last_name": "Ambastha",
"permalink": "ritesh-ambastha"
},
"title": "Product Manager"
}
],
"screenshots": [],
"tag_list": null,
"total_money_raised": "$0",
"twitter_username": null,
"updated_at": "Thu Dec 01 07:37:10 UTC 2011",
"video_embeds": []
}

このコレクションには、ランダムに生成された学生の成績があります。 各ドキュメントには、クラスを識別するclass_idと、学生を識別するstudent_idが含まれています。 すべての学生クラスのテスト スコアは、評価のタイプとその評価の学生スコアを表す 2 つのフィールドを持つサブドキュメントを含むscores配列に保存されます。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "56d5f7eb604eb380b0d8d8fa"
},
"class_id": {
"$numberDouble": "173"
},
"scores": [
{
"score": {
"$numberDouble": "19.81430597438296"
},
"type": "exam"
},
{
"score": {
"$numberDouble": "16.851404299968642"
},
"type": "quiz"
},
{
"score": {
"$numberDouble": "60.108751761488186"
},
"type": "homework"
},
{
"score": {
"$numberDouble": "22.886167083915776"
},
"type": "homework"
}
],
"student_id": {
"$numberDouble": "4"
}
}

inspectionsコレクションは NYC OpenData から取得されました データセット。各inspectionsドキュメントには次の情報が含まれています。

  • 検査されたビジネス名、セクター、アドレス、

  • 検査ID、結果、日付、証明書番号。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "56d61033a378eccde8a8357e"
},
"address": {
"city": "LAWRENCE",
"number": 1,
"street": "BAY BLVD",
"zip": 11559
},
"business_name": "SPRAGUE OPERATING RESOURCES LLC.",
"certificate_number": 3019422,
"date": "Mar 3 2015",
"id": "11247-2015-ENFO",
"result": "Fail",
"sector": "Fuel Oil Dealer - 814"
}

postsコレクションは、ドキュメント ボディ フィールドのシードとして US 上で使用して作成された、ランダムに生成されたブログ投稿のセットです。 各ドキュメントには、次の内容があります。

  • 本文テキスト、著者、パーマリンク、日付、タイトルなどのブログ投稿に関する情報、

  • ランダムに生成されたタグのリスト

  • ランダムに生成されたコメント サブドキュメントのリスト。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "50ab0f8bbcf1bfe2536dc3f9"
},
"author": "machine",
"body": "Amendment I\n<p>Congress shall make no law respecting ... ",
"comments": [
{
"author": "Santiago Dollins",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "HvizfYVx@pKvLaagH.com"
},
{
"author": "Jaclyn Morado",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "WpOUCpdD@hccdxJvT.com"
}
...
],
"date": {
"$date": {
"$numberLong": "1332804016000"
}
},
"permalink": "aRjNnLZkJkTyspAIoRGe",
"tags": [
"watchmaker",
"santa",
"xylophone",
"math",
"handsaw",
"dream",
"undershirt",
"dolphin",
"tanker",
"action"
],
"title": "Bill of Rights"
}

routesコレクション データは オープン ルートから取得されています データ。このコレクションのドキュメントには、都市間の航空ルートに関する情報が含まれています。

各ドキュメントには、次の情報が含まれています。

  • 名前、エイリアス、一意の識別子、 IAT航空コードを含むサブドキュメント内の航空会社データ

  • ソースフィールドと宛先フィールドは、 IATA コードを識別し、

  • ルート コード共有と停止数。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "56e9b39b732b6122f877fa5c"
},
"airline": {
"alias": "2G",
"iata": "CRG",
"id": 1654,
"name": "Cargoitalia"
},
"airplane": "A81",
"codeshare": "",
"dst_airport": "OVB",
"src_airport": "BTK",
"stops": 0
}

tripsコレクションには、ニューヨーク市のCIDR サービスからの収集されたデータが含まれています。 ドキュメントは、次の要素で構成されています。

  • 自転車用識別子、

  • トリップの開始と停止の時刻と日付、

  • 行します。

  • [] 、[] 、[] 、サービスの種類(カスタマーまたはサブスクリプション)などのユーザー情報。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "572bb8222b288919b68abf82"
},
"bikeid": 14785,
"birth year": 1977,
"end station id": 433,
"end station location": {
"coordinates": [
-73.98057249,
40.72955361
],
"type": "Point"
},
"end station name": "E 13 St & Avenue A",
"gender": 1,
"start station id": 518,
"start station location": {
"coordinates": [
-73.9734419,
40.74780373
],
"type": "Point"
},
"start station name": "E 39 St & 2 Ave",
"start time": {
"$date": {
"$numberLong": "1332804016000"
}
},
"stop time": {
"$date": {
"$numberLong": "1352114016000"
}
},
"tripduration": 812,
"usertype": "Subscriber"
}

zipsコレクションには、米国の都市とその地域の郵便番号の情報が含まれています。 ドキュメントには、都市名、地域の郵便番号、都市の中心的地理座標(緯度と経度)、州、人口に関する情報が含まれています。

このデータセットは、 2 d インデックスの作成とクエリを調査するために使用されます。

このコレクションには、以下のインデックスが含まれます。

名前
Index
説明

_id_

{ "_id": 1 }

_idフィールドのプライマリキー インデックス。

{
"_id": {
"$oid": "5c8eccc1caa187d17ca6ed29"
},
"city": "CLEVELAND",
"loc": {
"x": 86.559355,
"y": 33.992106
},
"pop": 2369,
"state": "AL",
"zip": "35049"
}

戻る

日用品店