{"id":9388,"date":"2020-10-05T09:07:58","date_gmt":"2020-10-05T07:07:58","guid":{"rendered":"https:\/\/www.giusseppe.net\/blog\/?p=9388"},"modified":"2020-10-02T17:48:54","modified_gmt":"2020-10-02T15:48:54","slug":"dictionary-of-the-spanish-language-text-analysis","status":"publish","type":"post","link":"https:\/\/www.giusseppe.net\/blog\/archivo\/2020\/10\/05\/dictionary-of-the-spanish-language-text-analysis\/","title":{"rendered":"Dictionary of the Spanish language Text Analysis"},"content":{"rendered":"<p>El 20 de agosto de este \u00abpeculiar\u00bb 2020 recib\u00ed un simp\u00e1tico correo electr\u00f3nico de un hombre llamado \u00abGerm\u00e1n Andr\u00e9s Segura Tinoco\u00bb que me dec\u00eda:<\/p>\n<blockquote><p>Buscando en Internet, encontr\u00e9 en su website el <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2019\/04\/01\/version-actualizada-del-diccionario-de-la-rae-en-modo-texto\/\">diccionario de la RAE en modo texto plano<\/a>, el cual me pareci\u00f3 genial y quisiera usarlo en un proyecto personal (sin fines de lucro) y <a href=\"https:\/\/github.com\/ansegura7\" target=\"_blank\" rel=\"noopener noreferrer\">publicar el resultado en mi GitHub<\/a>, en donde tengo mis proyectos de inform\u00e1tica p\u00fablicos.<\/p>\n<p>Por lo tanto, quer\u00eda preguntarle, \u00bfcu\u00e1l es la forma correcta de citarlo o de darle agradecimientos?<\/p><\/blockquote>\n<p>No es la primera vez que me pasa algo as\u00ed desde que realic\u00e9 el trabajo de recopilar <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2019\/04\/01\/version-actualizada-del-diccionario-de-la-rae-en-modo-texto\/\">todas las palabras (tecle\u00e1ndolas) del diccionario de la RAE<\/a> para aquel, lejano ya, <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2016\/06\/30\/diccionario-personal-de-la-lengua-espanola\/\">proyecto de Isidoro Valc\u00e1rcel Medina<\/a>. Sin ir m\u00e1s lejos, el a\u00f1o pasado una persona desde <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2019\/04\/01\/version-actualizada-del-diccionario-de-la-rae-en-modo-texto\/\">Chile me dec\u00eda que lo estaba usando para \u00abense\u00f1ar a hablar\u00bb<\/a> a una m\u00e1quina. As\u00ed como la gran <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2019\/06\/04\/performance-en-instituto-cervantes\/\">colaboraci\u00f3n que realic\u00e9 dentro del interesant\u00edsimo proyecto de Marta PCampos<\/a> <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2018\/05\/16\/19142014-es\/\">1914-2014<\/a> sobre las palabras que hab\u00edan desaparecido del diccionario en esos 100 a\u00f1os. Su precioso trabajo que yo denomino \u00abPalabras Muertas\u00bb.<\/p>\n<p>Yo le respond\u00ed cort\u00e9smente con un email ese mismo d\u00eda dici\u00e9ndole:<\/p>\n<blockquote><p>Por supuesto eres libre de usarlo en un proyecto personal sin \u00e1nimo de lucro o, incluso, remunerado. Son las palabras de la RAE&#8230; es decir, de todos, que yo tan s\u00f3lo he tecleado (ante la imposibilidad de conseguir una versi\u00f3n digital).<\/p>\n<p>Puedes citarme como te d\u00e9 la gana, pero agradecer\u00eda que citases mi nombre y website:<br \/>\nGiusseppe Dom\u00ednguez <a href=\"https:\/\/www.giusseppe.net\">https:\/\/www.giusseppe.net<\/a><\/p>\n<p>Te env\u00edo, no obstante, una <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2019\/04\/01\/version-actualizada-del-diccionario-de-la-rae-en-modo-texto\/\">entrada del blog con una versi\u00f3n lo m\u00e1s actualizada posible<\/a> (en Mega) y no me responsabilizo de posibles errores&#8230; que voy corrigiendo, pero que seguro que alguna quedar\u00e1. Si necesitas alg\u00fan tipo de \u00absecci\u00f3n\u00bb del mismo o alguna cosa curiosa&#8230; puedes dec\u00edrmelo y si tengo ocasi\u00f3n, cuenta conmigo.<\/p>\n<p>Un cordial saludo y hasta pronto,<br \/>\nGiusseppe<\/p><\/blockquote>\n<div style=\"background-color:white;width:90%;margin-left:5%;margin-bottom:20px;\"><a href=\"https:\/\/ansegura7.github.io\/DSL_Analysis\/pages\/dsl_text_analysis.html\" rel=\"noopener noreferrer\" target=\"_blank\"><img decoding=\"async\" src=\"https:\/\/www.giusseppe.net\/blog\/wp-content\/uploads\/2020\/10\/palabrastamano.png\" alt=\"\" width=\"100%\" class=\"aligncenter size-full wp-image-9389\" srcset=\"https:\/\/www.giusseppe.net\/blog\/wp-content\/uploads\/2020\/10\/palabrastamano.png 736w, https:\/\/www.giusseppe.net\/blog\/wp-content\/uploads\/2020\/10\/palabrastamano-300x159.png 300w\" sizes=\"(max-width: 736px) 100vw, 736px\" \/><\/a><\/div>\n<p>Fue muy bonito e interesante encontrarse en d\u00f3nde hab\u00eda utilizado esas palabras y para qu\u00e9: un <a href=\"https:\/\/ansegura7.github.io\/DSL_Analysis\/pages\/dsl_text_analysis.html\" rel=\"noopener noreferrer\" target=\"_blank\">an\u00e1lisis estad\u00edstico de las palabras en espa\u00f1ol<\/a>, adem\u00e1s de su gentileza a la hora de citarme en varios lugares agradeci\u00e9ndome mi contribuci\u00f3n (que siempre tiendo a minimizar, pues las palabras son p\u00fablicas).<\/p>\n<blockquote><p>Buenas tardes, estimado Giusseppe,<\/p>\n<p>Muchas gracias por su respuesta.<\/p>\n<p>Le comparto el link a la p\u00e1gina principal del proyecto en el que estoy trabajando, en donde realizo el agradecimiento a usted (en la secci\u00f3n Acknowledgment), con link a su website.<br \/>\n<a href=\"https:\/\/ansegura7.github.io\/DSL_Analysis\/\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/ansegura7.github.io\/DSL_Analysis\/<\/a><\/p>\n<p>Tambi\u00e9n le comparto el resultado del an\u00e1lisis descriptivo en el que estoy trabajando. Agradecer\u00eda sus comentarios al respecto.<br \/>\n<a href=\"https:\/\/ansegura7.github.io\/DSL_Analysis\/pages\/dsl_text_analysis.html\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/ansegura7.github.io\/DSL_Analysis\/pages\/dsl_text_analysis.html<\/a><br \/>\nPr\u00f3ximamente, estar\u00e9 compartiendo los resultados por Twitter. Por lo tanto, agradecer\u00eda si me indica el nombre de usuario de su cuenta Twitter, para poder mencionarlo.<\/p>\n<p>Una vez m\u00e1s, muchas gracias por compartir y recopilar el dataset del DLE.<\/p>\n<p>Saludos cordiales,<br \/>\nAndr\u00e9s Segura Tinoco<\/p><\/blockquote>\n<p>Me resulta simp\u00e1tico que llamen \u00abdataset\u00bb al conjunto o listado de las palabras que recoge la RAE en su DLE. Los enlaces del proyecto de Andr\u00e9s son fant\u00e1sticos y es un trabajo divertido que seguro que adem\u00e1s alguien considera \u00fatil.<\/p>\n<p>En su proyecto mezclaba dos de mis grandes pasiones: <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2020\/09\/25\/busqueda-de-palabras-en-la-rae-en-linea-de-comandos\/\">la programaci\u00f3n y el lenguaje<\/a>, cosa que suelo hacer con frecuencia y que, pr\u00f3ximamente, har\u00e9 a\u00fan m\u00e1s. As\u00ed que estuve cotilleando con suma atenci\u00f3n hasta que cre\u00ed que pod\u00eda hacerle una sugerencia \u00fatil, adem\u00e1s de <a href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2020\/03\/19\/un-pequeno-divertimento-en-python\/\">agradecerle su agradecimiento (entrando en un curioso bucle)<\/a><\/p>\n<blockquote><p>Me alegra saber que te sirve el material recopilado.<\/p>\n<p>He estado ojeando tu proyecto y tiene una pinta estupenda. Me encantan los an\u00e1lisis y tu codificaci\u00f3n es muy limpia y bien comentada.<\/p>\n<p>Como \u00fanica sugerencia (no muy dif\u00edcil de hacer) es la de escribir todas las frases del an\u00e1lisis en un array (o un archivo externo) que puede modificarse sencillamente para traducciones a otros idiomas. Me explico, por ejemplo, en la parte del c\u00f3digo:<\/p>\n<pre class=\"EnlighterJSRAW\" data-enlighter-language=\"python\">\"source\": [\r\n  \"# Show results\\n\",\r\n  \"n_words = len(word_dict)\\n\",\r\n  \"print('Total of different words: %d' % n_words)\"\r\n]<\/pre>\n<p>podr\u00edas sustituir el print por algo as\u00ed como:<\/p>\n<p><code>\"print('%s: %d' % msg_total_words[i], n_words)\"<\/code><\/p>\n<p>y tener un array de cadenas msg_total_words[LANGUAGES] o algo similar&#8230; (disculpa mi escaso conocimiento de python)<\/p>\n<p>Es s\u00f3lo una insignificante sugerencia que, seguramente, se puede hacer mejor que como te sugiero. (Leyendo los textos\/mensajes de un archivo idiom\u00e1tico, por ejemplo)<\/p>\n<p>Quiz\u00e1 me ha llamado la atenci\u00f3n especialmente por el hecho de que no est\u00e9 en espa\u00f1ol el resultado, lo que comprendo desde el punto de vista de la divulgaci\u00f3n, pero tambi\u00e9n me resulta parad\u00f3jico siendo que se habla sobre el espa\u00f1ol&#8230; \ud83d\ude09<\/p>\n<p>Much\u00edsimas gracias por la atribuci\u00f3n y espero que no te molesten mis sugerencias.<\/p>\n<p>Un cordial saludo,<br \/>\nGiusseppe<\/p>\n<p>PS: No uso Twitter. Tengo cuenta de Facebook e Instagram, just in case&#8230;<br \/>\n<a href=\"https:\/\/www.facebook.com\/giusseppe.dominguez\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.facebook.com\/giusseppe.dominguez<\/a> (perfil personal)<br \/>\n<a href=\"https:\/\/www.facebook.com\/giusseppedelaaalaz\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.facebook.com\/giusseppedelaaalaz<\/a> (p\u00e1gina \u00aboficial\u00bb)<br \/>\n<a href=\"https:\/\/www.instagram.com\/giusseppe.dominguez\" target=\"_blank\" rel=\"noopener noreferrer\">https:\/\/www.instagram.com\/giusseppe.dominguez<\/a>\n<\/p><\/blockquote>\n<p>Y en \u00faltimo agradecimiento, me escribi\u00f3 unos d\u00edas despu\u00e9s con los resultados que estaba obteniendo para hacerme part\u00edcipe de su publicaci\u00f3n. (Lo que es de agradecer).<\/p>\n<blockquote><p>Estimado Giusseppe,<\/p>\n<p>Muchas gracias por tu sugerencia. Me parece s\u00faper v\u00e1lida y \u00fatil para mayor y mejor divulgaci\u00f3n del material publicado. La tendr\u00e9 en cuenta para este y futuros proyectos.<\/p>\n<p>Aprovecho el correo y te comento 3 cosas brevemente:<br \/>\n1. Cree un hilo en Twitter publicando algunos de los resultados obtenidos en mi an\u00e1lisis y al final hay un tweet agradeciendo y reconociendo tu aporte con link directo a tu sitio web. Te comparto el enlace al hilo (son solo 8 tweets) por si los quieres revisar: <a href=\"https:\/\/twitter.com\/seguraandres7\/status\/1298025632090259458?s=21\" rel=\"noopener noreferrer\" target=\"_blank\">https:\/\/twitter.com\/seguraandres7\/status\/1298025632090259458?s=21<\/a><\/p>\n<p>2. He hecho algunas correcciones sobre las palabras recopiladas. <strong>Encontr\u00e9 como 2 o 3 palabras en donde se acentuaban consonantes en vez de vocales y otros peque\u00f1os errores, en donde se invert\u00edan letras, sin embargo han sido menos de 10 correcciones hasta el momento<\/strong>. Una vez termine el proyecto, te env\u00edo de vuelta el diccionario de palabras, para que puedas actualizar el tuyo, de as\u00ed considerarlo.<\/p>\n<p>3. Para futuro networking o trabajos, te comparto mi sitio web y mi perfil de Twitter donde constantemente estoy publicando resultados de mis trabajos de investigaci\u00f3n personales o acad\u00e9micos. Curiosamente, yo no tengo Facebook. Website: <a href=\"https:\/\/ansegura7.github.io\/\" rel=\"noopener noreferrer\" target=\"_blank\">https:\/\/ansegura7.github.io\/<\/a> y usuario de twitter: <a href=\"https:\/\/twitter.com\/SeguraAndres7\" rel=\"noopener noreferrer\" target=\"_blank\">https:\/\/twitter.com\/SeguraAndres7<\/a><\/p>\n<p>Una vez mas, muchas gracias por recopilar y compartir este dataset tan valioso.<\/p>\n<p>Saludos cordiales,<br \/>\nAndres Segura Tinoco<br \/>\nTelf: +57 3555590546\n<\/p><\/blockquote>\n<p>Actualic\u00e9 mi diccionario con su revisi\u00f3n incorporada, para poder utilizarlo en nuevos proyectos, pero s\u00e9, soy consciente, que seguro que habr\u00e1 m\u00e1s errores. Quiz\u00e1 por ello en el proyecto \u00abCocinillas\u00bb en el que estoy metido ahora mismo he querido incorporar un \u00abtesteador\u00bb o comprobador, para saber si la palabra que busco en el diccionario existe o no y, en caso contrario, hacer un listado con todas las palabras err\u00f3neas que tengo y poder mejorar mi diccionario en texto plano (aunque espero que la pr\u00f3xima vez que lo actualice pueda incorporar, incluso, todas las definiciones).<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El 20 de agosto de este \u00abpeculiar\u00bb 2020 recib\u00ed un simp\u00e1tico correo electr\u00f3nico de un hombre llamado \u00abGerm\u00e1n Andr\u00e9s Segura Tinoco\u00bb que me dec\u00eda: Buscando en Internet, encontr\u00e9 en su website el diccionario de la RAE en modo texto plano, el cual me pareci\u00f3 genial y quisiera usarlo en un proyecto personal (sin fines de &#8230; <a title=\"Dictionary of the Spanish language Text Analysis\" class=\"read-more\" href=\"https:\/\/www.giusseppe.net\/blog\/archivo\/2020\/10\/05\/dictionary-of-the-spanish-language-text-analysis\/\">Read more<span class=\"screen-reader-text\">Dictionary of the Spanish language Text Analysis<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[126,69,232,128,110],"tags":[162,112,76,98,182,108,101,130,105],"class_list":["post-9388","post","type-post","status-publish","format-standard","hentry","category-ajenos","category-confidencias","category-programable","category-proyectos","category-tecnologia-opinion","tag-diccionario","tag-giusseppe","tag-informatica","tag-internet","tag-isidoro-valcarcel-medina","tag-lecturas","tag-matematicas","tag-proyectos-2","tag-tecnologia"],"_links":{"self":[{"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/posts\/9388","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/comments?post=9388"}],"version-history":[{"count":4,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/posts\/9388\/revisions"}],"predecessor-version":[{"id":9393,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/posts\/9388\/revisions\/9393"}],"wp:attachment":[{"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/media?parent=9388"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/categories?post=9388"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.giusseppe.net\/blog\/wp-json\/wp\/v2\/tags?post=9388"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}