Las nubes de palabras representan visualmente datos de texto, destacando palabras clave y frases prevalentes. La frecuencia con la que aparece cada palabra se refleja por el tamaño de la palabra.
Canales de codificación de nubes de palabras
Las nubes de palabras proporcionan lo siguiente canales de codificación:
Canal de codificación | Tipo de canal | Descripción |
|---|---|---|
Text | Categoría | Los valores de texto que se añadirán a la nube de palabras. Charts añade cada valor único del campo aplicado a este canal a la nube de palabras. Las nubes de palabras pueden mostrar un máximo de 100 valores. Si el campo aplicado a este canal contiene más de 100 valores únicos, el gráfico muestra una muestra aleatoria de 100 valores. Para garantizar que el gráfico solo muestre las palabras más comunes, debe aplicar un límite y ordenar por Value. |
Tamaño | Agregación | Indica el campo que se va a agregar y el tipo de agregación que se va a realizar. Los resultados de la agregación definen el tamaño de cada valor Text; cuanto mayor sea el valor agregado, mayor será el tamaño del texto. Por ejemplo, si configura los canales Text y Size en el Si establece el canal Text en el campo |
Color | Categoría | (Opcional) Colorea cada valor de texto para indicar un valor de datos correspondiente del campoaplicado. Por ejemplo, si configura los canales Text, Size y Color en el campo Si configuras los canales Text y Size en el campo |
Casos de uso
Utilice nubes de palabras para mostrar la frecuencia de palabras o frases específicas en campos de texto. Las nubes de palabras ofrecen una visión general de palabras y temas comunes en una serie de datos de texto. También pueden resaltar las frases más comunes de un conjunto conocido de cadenas, como categorías de productos o etiquetas.
Considere utilizar una nube de palabras para:
Mostrar palabras y frases comunes utilizadas en las reseñas de un producto.
Identificar términos comunes en el contenido existente para mejorar Posicionamiento web (SEO).
Resalte los puntos débiles específicos de los clientes a partir de encuestas de usuarios agregadas.
Ejemplos
Las nubes de palabras se utilizan comúnmente para mostrar la frecuencia con la que aparecen palabras en campos de texto largos. De forma predeterminada, no dividen los campos de texto en palabras, sino que intentan visualizar todo el campo de texto como un único valor. Se puede usar una canalización de agregación para dividir un campo de texto en palabras individuales.
Nota
El conjunto de datos utilizado en este tutorial está incluido en el
sample_airbnb.listingsAndReviews
conjunto de datos proporcionado por Atlas.
El siguiente ejemplo crea una nube de palabras a partir de un conjunto de datos con información sobre propiedades en alquiler de AirBnB. Cada anuncio de propiedad contiene un campo description; un campo de texto que describe la propiedad.
Primero, ejecutamos una canalización de agregación para preprocesar el campo description. La siguiente canalización de agregación:
Splitseldescriptioncampo en una matriz donde cada palabra individual es un elemento de la matriz.Unwindsesta matriz, creando un nuevo documento para cada palabra individual de cadadescriptioncampo.Adds a new fieldllamówordsa a la colección, donde cada palabra desenrollada de sedescriptionconvierte en un valor de.wordsRealiza una
$matchconsulta de modo que solo se agreguen palabras no triviales a la nube de palabras.
Procedimiento
Pegue la siguiente secuencia de agregación en la barra Query en la parte superior del Generador de gráficos:
[ { $addFields: { words: { $map: { input: { $split: ['$description', ' '] }, as: 'str', in: { $trim: { input: { $toLower: ['$$str'] }, chars: " ,|(){}-<>.;" } } } } } }, { $unwind: '$words' }, { $match: { words: { $nin: ["", "also", "i", "me", "my", "myself", "we", "us", "our", "ours", "ourselves", "you", "your", "yours", "yourself", "yourselves", "he", "him", "his", "himself", "she", "her", "hers", "herself", "it", "its", "itself", "they", "them", "their", "theirs", "themselves", "what", "which", "who", "whom", "whose", "this", "that", "these", "those", "am", "is", "are", "was", "were", "be", "been", "being", "have", "has", "had", "having", "do", "does", "did", "doing", "will", "would", "should", "can", "could", "ought", "i'm", "you're", "he's", "she's", "it's", "we're", "they're", "i've", "you've", "we've", "they've", "i'd", "you'd", "he'd", "she'd", "we'd", "they'd", "i'll", "you'll", "he'll", "she'll", "we'll", "they'll", "isn't", "aren't", "wasn't", "weren't", "hasn't", "haven't", "hadn't", "doesn't", "don't", "didn't", "won't", "wouldn't", "shan't", "shouldn't", "can't", "cannot", "couldn't", "mustn't", "let's", "that's", "who's", "what's", "here's", "there's", "when's", "where's", "why's", "how's", "a", "an", "the", "and", "but", "if", "or", "because", "as", "until", "while", "of", "at", "by", "for", "with", "about", "against", "between", "into", "through", "during", "before", "after", "above", "below", "to", "from", "up", "upon", "down", "in", "out", "on", "off", "over", "under", "again", "further", "then", "once", "here", "there", "when", "where", "why", "how", "all", "any", "both", "each", "few", "more", "most", "other", "some", "such", "no", "nor", "not", "only", "own", "same", "so", "than", "too", "very", "say", "says", "said", "shall"] } } } ] Haga clic en Apply para ejecutar la canalización.
Ahora que tenemos un nuevo campo que contiene las palabras individuales de cada reseña, podemos visualizar esas palabras en una nube de palabras.
Aplique el campo
wordsrecién creado al canal de codificación Text para agregar cada palabra individual a la nube de palabras.Aplica un límite de 80 para mostrar solo las 80 palabras más comunes en las revisiones.
Aplique el campo
wordsal canal de codificación Size y agregue según el recuento de cada palabra individual.
Tu nube de palabras debería verse así:

El tamaño de las palabras en la nube representa su frecuencia relativa.
Limitaciones
El tamaño máximo de la respuesta de query para una nube de palabras es de 5000 documentos.