Docs Menu
Docs Home
/ /

Conjunto de datos de entrenamiento de muestra

El sample_training database contains a set of realistic data used in MongoDB Private Training Offerings. This dataset is based on public available data sources such as:

Nuestros estudiantes utilizan estos conjuntos de datos realistas para explorar la funcionalidad de MongoDB en nuestros laboratorios de capacitación y ejercicios privados.

Para aprender a cargar los datos de muestra proporcionados por Atlas en su clúster, consulte Cargar datos de muestra.

La base de datos sample_training contiene las siguientes colecciones:

Nombre de colección
Descripción

Contiene una lista de información de empresas de Crunchbase Data.

Contiene información sobre las calificaciones de los estudiantes en una clase determinada, incluidos los puntajes en diferentes evaluaciones.

Contiene una lista de inspecciones comerciales de la ciudad de Nueva York, incluyendo si la empresa aprobó o no la inspección.

Contiene discursos aleatorios del Senado de EE. UU. organizados como publicaciones de blog con comentarios generados aleatoriamente.

Contiene información sobre rutas aéreas, con aeropuertos de origen y destino, la aerolínea de servicio y el tipo de avión. Esta colección se utiliza en laboratorios que exploran la etapa de agregación de $graphLookup.

Contiene datos de viajes de Citibike de la ciudad de Nueva York. Estos datos son útiles para explorar la etapa de agregación de $graphLookup y mostrar consultas geoespaciales.

Contiene datos generales de códigos postales de ciudades de Estados Unidos.

Esta colección contiene información sobre empresas que cotizan en Crunchbase. Incluye información diversa, como su sitio web y/o blogs sobre la empresa, rondas de financiación y personas conocidas asociadas a ella.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "52cdef7c4bab8bd675298291"
},
"acquisition": null,
"acquisitions": [],
"alias_list": null,
"blog_feed_url": "http://mobiance.wordpress.com/feed/",
"blog_url": "http://mobiance.wordpress.com/",
"category_code": "web",
"competitions": [],
"created_at": "Tue Feb 12 17:31:58 UTC 2008",
"crunchbase_url": "http://www.crunchbase.com/company/mobiance",
"deadpooled_day": null,
"deadpooled_month": null,
"deadpooled_url": null,
"deadpooled_year": null,
"description": null,
"email_address": "info@mobiance.com",
"external_links": [],
"founded_day": {
"$numberInt": "1"
},
"founded_month": {
"$numberInt": "10"
},
"founded_year": {
"$numberInt": "2004"
},
"funding_rounds": [],
"homepage_url": "http://www.mobiance.com",
"image": {
"attribution": null,
"available_sizes": [
[
[
{
"$numberInt": "150"
},
{
"$numberInt": "43"
}
],
"assets/images/resized/0001/1859/11859v1-max-150x150.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-250x250.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-450x450.png"
]
]
},
"investments": [],
"ipo": null,
"milestones": [],
"name": "Mobiance",
"number_of_employees": {
"$numberInt": "5"
},
"offices": [
{
"address1": "BC-3, Atrium Business Center,",
"address2": "Coles Road, Frazer Town,",
"city": "Bangalore",
"country_code": "IND",
"description": null,
"latitude": null,
"longitude": null,
"state_code": null,
"zip_code": "560005"
}
],
"overview": "<p>Mobiance provides the technology to track cell phones ...",
"partners": [],
"permalink": "mobiance",
"phone_number": "+91-80- 41264756",
"products": [],
"providerships": [],
"relationships": [
{
"is_past": true,
"person": {
"first_name": "Ritesh",
"last_name": "Ambastha",
"permalink": "ritesh-ambastha"
},
"title": "Product Manager"
}
],
"screenshots": [],
"tag_list": null,
"total_money_raised": "$0",
"twitter_username": null,
"updated_at": "Thu Dec 01 07:37:10 UTC 2011",
"video_embeds": []
}

Esta colección genera aleatoriamente las calificaciones de los estudiantes. Cada documento contiene un class_id que identifica la clase y un student_id que identifica al estudiante. Todas las calificaciones de los exámenes de cada clase se almacenan en la matriz scores, que contiene subdocumentos con dos campos que representan el tipo de evaluación y la calificación del estudiante en dicha evaluación.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "56d5f7eb604eb380b0d8d8fa"
},
"class_id": {
"$numberDouble": "173"
},
"scores": [
{
"score": {
"$numberDouble": "19.81430597438296"
},
"type": "exam"
},
{
"score": {
"$numberDouble": "16.851404299968642"
},
"type": "quiz"
},
{
"score": {
"$numberDouble": "60.108751761488186"
},
"type": "homework"
},
{
"score": {
"$numberDouble": "22.886167083915776"
},
"type": "homework"
}
],
"student_id": {
"$numberDouble": "4"
}
}

La inspections colección se extrajo del conjunto de datos NYC OpenData. Cada inspections documento contiene información sobre:

  • El nombre, sector y dirección de la empresa inspeccionada,

  • Identificación de inspección, resultado, fecha y número de certificado.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "56d61033a378eccde8a8357e"
},
"address": {
"city": "LAWRENCE",
"number": 1,
"street": "BAY BLVD",
"zip": 11559
},
"business_name": "SPRAGUE OPERATING RESOURCES LLC.",
"certificate_number": 3019422,
"date": "Mar 3 2015",
"id": "11247-2015-ENFO",
"result": "Fail",
"sector": "Fuel Oil Dealer - 814"
}

La colección posts es un conjunto de entradas de blog generadas aleatoriamente, creadas con discursos del Senado de EE. UU. como semilla para el campo "cuerpo del documento". En cada documento encontrará:

  • Información sobre las publicaciones del blog, como el cuerpo del texto, el autor, el enlace permanente, la fecha y el título,

  • Lista de etiquetas generada aleatoriamente,

  • Lista generada aleatoriamente de subdocumentos de comentarios.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "50ab0f8bbcf1bfe2536dc3f9"
},
"author": "machine",
"body": "Amendment I\n<p>Congress shall make no law respecting ... ",
"comments": [
{
"author": "Santiago Dollins",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "HvizfYVx@pKvLaagH.com"
},
{
"author": "Jaclyn Morado",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "WpOUCpdD@hccdxJvT.com"
}
...
],
"date": {
"$date": {
"$numberLong": "1332804016000"
}
},
"permalink": "aRjNnLZkJkTyspAIoRGe",
"tags": [
"watchmaker",
"santa",
"xylophone",
"math",
"handsaw",
"dream",
"undershirt",
"dolphin",
"tanker",
"action"
],
"title": "Bill of Rights"
}

Los routes datos de la colección se obtuvieron de los datos de Open Flights. Los documentos de esta colección contienen información sobre rutas aéreas entre aeropuertos.

Cada documento contiene información sobre:

  • Datos de la aerolínea en subdocumento que contiene el nombre, alias, identificador único y el código IATA de la aerolínea,

  • Los aeropuertos de origen y destino, identificados con su código de aeropuerto IATA,

  • Código compartido de ruta y número de paradas.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "56e9b39b732b6122f877fa5c"
},
"airline": {
"alias": "2G",
"iata": "CRG",
"id": 1654,
"name": "Cargoitalia"
},
"airplane": "A81",
"codeshare": "",
"dst_airport": "OVB",
"src_airport": "BTK",
"stops": 0
}

La colección trips contiene datos de viajes en bicicleta del servicio Citibike de la ciudad de Nueva York. Los documentos se componen de:

  • Identificador único de bicicleta,

  • Hora y fecha de inicio y finalización del viaje,

  • Nombres de las estaciones de inicio y fin del viaje y ubicación geoespacial,

  • Información del usuario como género, año de nacimiento y tipo de servicio (Cliente o Suscriptor).

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "572bb8222b288919b68abf82"
},
"bikeid": 14785,
"birth year": 1977,
"end station id": 433,
"end station location": {
"coordinates": [
-73.98057249,
40.72955361
],
"type": "Point"
},
"end station name": "E 13 St & Avenue A",
"gender": 1,
"start station id": 518,
"start station location": {
"coordinates": [
-73.9734419,
40.74780373
],
"type": "Point"
},
"start station name": "E 39 St & 2 Ave",
"start time": {
"$date": {
"$numberLong": "1332804016000"
}
},
"stop time": {
"$date": {
"$numberLong": "1352114016000"
}
},
"tripduration": 812,
"usertype": "Subscriber"
}

La colección zips contiene información sobre ciudades de EE. UU. y su código postal. Los documentos contienen información sobre el nombre de la ciudad, el código postal, las coordenadas geográficas del centro (latitud y longitud), el estado y la población.

Este conjunto de datos se utiliza para explorar la creación y las consultas 2del índice d.

Esta colección contiene los siguientes índices:

Nombre
Index
Descripción

_id_

{ "_id": 1 }

Índice de llave primaria en el campo _id.

{
"_id": {
"$oid": "5c8eccc1caa187d17ca6ed29"
},
"city": "CLEVELAND",
"loc": {
"x": 86.559355,
"y": 33.992106
},
"pop": 2369,
"state": "AL",
"zip": "35049"
}

Volver

Sample Supplies

En esta página