Diccionario
Cierto desconcierto
abierto, ta/ acierto/ aliabierto, ta/ boquiabierto, ta/ cierto, ta/ concierto/ corniabierto, ta/ cubierto/ desacierto/ desconcierto/ descubierto, ta/ desierto, ta/ despierto, ta/ dispierto, ta/ encubierto, ta/ entreabierto/ incierto, ta/ macroconcierto/ maniabierto, ta/ patiabierto, ta/ perniabierto, ta/ piernabierto, ta/ reabierto, ta/ recubierto, ta/ redescubierto, ta/ semiabierto, ta
El otro día en un taller de poesía alguien usó la palabra «descubierto» y me quedé con ganas de pasarle las palabras en el DLE que terminasen en «bierto», pero eran realmente pocas, así que me decidí por una búsqueda de aquellas que terminan en «ierto» que son unas pocas más: 26.
Ahí están.
Dictionary of the Spanish language Text Analysis
El 20 de agosto de este «peculiar» 2020 recibí un simpático correo electrónico de un hombre llamado «Germán Andrés Segura Tinoco» que me decía:
Buscando en Internet, encontré en su website el diccionario de la RAE en modo texto plano, el cual me pareció genial y quisiera usarlo en un proyecto personal (sin fines de lucro) y publicar el resultado en mi GitHub, en donde tengo mis proyectos de informática públicos.
Por lo tanto, quería preguntarle, ¿cuál es la forma correcta de citarlo o de darle agradecimientos?
No es la primera vez que me pasa algo así desde que realicé el trabajo de recopilar todas las palabras (tecleándolas) del diccionario de la RAE para aquel, lejano ya, proyecto de Isidoro Valcárcel Medina. Sin ir más lejos, el año pasado una persona desde Chile me decía que lo estaba usando para «enseñar a hablar» a una máquina. Así como la gran colaboración que realicé dentro del interesantísimo proyecto de Marta PCampos 1914-2014 sobre las palabras que habían desaparecido del diccionario en esos 100 años. Su precioso trabajo que yo denomino «Palabras Muertas».
Yo le respondí cortésmente con un email ese mismo día diciéndole:
Por supuesto eres libre de usarlo en un proyecto personal sin ánimo de lucro o, incluso, remunerado. Son las palabras de la RAE… es decir, de todos, que yo tan sólo he tecleado (ante la imposibilidad de conseguir una versión digital).
Puedes citarme como te dé la gana, pero agradecería que citases mi nombre y website:
Giusseppe Domínguez https://www.giusseppe.netTe envío, no obstante, una entrada del blog con una versión lo más actualizada posible (en Mega) y no me responsabilizo de posibles errores… que voy corrigiendo, pero que seguro que alguna quedará. Si necesitas algún tipo de «sección» del mismo o alguna cosa curiosa… puedes decírmelo y si tengo ocasión, cuenta conmigo.
Un cordial saludo y hasta pronto,
Giusseppe
Fue muy bonito e interesante encontrarse en dónde había utilizado esas palabras y para qué: un análisis estadístico de las palabras en español, además de su gentileza a la hora de citarme en varios lugares agradeciéndome mi contribución (que siempre tiendo a minimizar, pues las palabras son públicas).
Buenas tardes, estimado Giusseppe,
Muchas gracias por su respuesta.
Le comparto el link a la página principal del proyecto en el que estoy trabajando, en donde realizo el agradecimiento a usted (en la sección Acknowledgment), con link a su website.
https://ansegura7.github.io/DSL_Analysis/También le comparto el resultado del análisis descriptivo en el que estoy trabajando. Agradecería sus comentarios al respecto.
https://ansegura7.github.io/DSL_Analysis/pages/dsl_text_analysis.html
Próximamente, estaré compartiendo los resultados por Twitter. Por lo tanto, agradecería si me indica el nombre de usuario de su cuenta Twitter, para poder mencionarlo.Una vez más, muchas gracias por compartir y recopilar el dataset del DLE.
Saludos cordiales,
Andrés Segura Tinoco
Me resulta simpático que llamen «dataset» al conjunto o listado de las palabras que recoge la RAE en su DLE. Los enlaces del proyecto de Andrés son fantásticos y es un trabajo divertido que seguro que además alguien considera útil.
En su proyecto mezclaba dos de mis grandes pasiones: la programación y el lenguaje, cosa que suelo hacer con frecuencia y que, próximamente, haré aún más. Así que estuve cotilleando con suma atención hasta que creí que podía hacerle una sugerencia útil, además de agradecerle su agradecimiento (entrando en un curioso bucle)
Me alegra saber que te sirve el material recopilado.
He estado ojeando tu proyecto y tiene una pinta estupenda. Me encantan los análisis y tu codificación es muy limpia y bien comentada.
Como única sugerencia (no muy difícil de hacer) es la de escribir todas las frases del análisis en un array (o un archivo externo) que puede modificarse sencillamente para traducciones a otros idiomas. Me explico, por ejemplo, en la parte del código:
"source": [ "# Show results\n", "n_words = len(word_dict)\n", "print('Total of different words: %d' % n_words)" ]podrías sustituir el print por algo así como:
"print('%s: %d' % msg_total_words[i], n_words)"y tener un array de cadenas msg_total_words[LANGUAGES] o algo similar… (disculpa mi escaso conocimiento de python)
Es sólo una insignificante sugerencia que, seguramente, se puede hacer mejor que como te sugiero. (Leyendo los textos/mensajes de un archivo idiomático, por ejemplo)
Quizá me ha llamado la atención especialmente por el hecho de que no esté en español el resultado, lo que comprendo desde el punto de vista de la divulgación, pero también me resulta paradójico siendo que se habla sobre el español… 😉
Muchísimas gracias por la atribución y espero que no te molesten mis sugerencias.
Un cordial saludo,
GiusseppePS: No uso Twitter. Tengo cuenta de Facebook e Instagram, just in case…
https://www.facebook.com/giusseppe.dominguez (perfil personal)
https://www.facebook.com/giusseppedelaaalaz (página «oficial»)
https://www.instagram.com/giusseppe.dominguez
Y en último agradecimiento, me escribió unos días después con los resultados que estaba obteniendo para hacerme partícipe de su publicación. (Lo que es de agradecer).
Estimado Giusseppe,
Muchas gracias por tu sugerencia. Me parece súper válida y útil para mayor y mejor divulgación del material publicado. La tendré en cuenta para este y futuros proyectos.
Aprovecho el correo y te comento 3 cosas brevemente:
1. Cree un hilo en Twitter publicando algunos de los resultados obtenidos en mi análisis y al final hay un tweet agradeciendo y reconociendo tu aporte con link directo a tu sitio web. Te comparto el enlace al hilo (son solo 8 tweets) por si los quieres revisar: https://twitter.com/seguraandres7/status/1298025632090259458?s=212. He hecho algunas correcciones sobre las palabras recopiladas. Encontré como 2 o 3 palabras en donde se acentuaban consonantes en vez de vocales y otros pequeños errores, en donde se invertían letras, sin embargo han sido menos de 10 correcciones hasta el momento. Una vez termine el proyecto, te envío de vuelta el diccionario de palabras, para que puedas actualizar el tuyo, de así considerarlo.
3. Para futuro networking o trabajos, te comparto mi sitio web y mi perfil de Twitter donde constantemente estoy publicando resultados de mis trabajos de investigación personales o académicos. Curiosamente, yo no tengo Facebook. Website: https://ansegura7.github.io/ y usuario de twitter: https://twitter.com/SeguraAndres7
Una vez mas, muchas gracias por recopilar y compartir este dataset tan valioso.
Saludos cordiales,
Andres Segura Tinoco
Telf: +57 3555590546
Actualicé mi diccionario con su revisión incorporada, para poder utilizarlo en nuevos proyectos, pero sé, soy consciente, que seguro que habrá más errores. Quizá por ello en el proyecto «Cocinillas» en el que estoy metido ahora mismo he querido incorporar un «testeador» o comprobador, para saber si la palabra que busco en el diccionario existe o no y, en caso contrario, hacer un listado con todas las palabras erróneas que tengo y poder mejorar mi diccionario en texto plano (aunque espero que la próxima vez que lo actualice pueda incorporar, incluso, todas las definiciones).
Búsqueda de palabras en la RAE en línea de comandos
He fabricado un script (un lote de comandos) de bash shell en Linux para descargar y juguetear con búsquedas en la RAE, ya que resulta complicado pedir que tengan la deferencia de hacerla disponible para el público, como si la RAE fuese un organismo público pagado con dinero público.
Es el paso intermedio entre buscar una palabra y descargarme el diccionario completo palabra a palabra. Ahora toca hacer un pequeño programita que lo invoque para cada una de las palabras que tecleé para el proyecto de Isidoro Valcárcel Medina hace unos años y traiga sus definiciones.
Lo he llamado buscaenrae.sh.
Esta versión está modificada sobre la que publiqué hace unos días para subsanar errores relacionados con las palabras que contienen varias entradas/acepciones (no es lo mismo acepciones que entradas y soy consciente de ello, pero no es importante), así como para retirar las conjugaciones en los verbos.
#!/bin/bash
### FUNCIONES ÚTILES PARA EL PROGRAMA
# uso() Instrucciones del programa y salida en caso de error.
uso () {
echo "Uso: $0 salida palabra"
echo -e "\tsalida es un valor númerico que identifica:"
echo -e "\t[0] para generar un archivo HTML con la respuesta"
echo -e "\t[1] para generar un archivo TXT con la respuesta"
echo -e "\t[2] para generar una línea TXT con la respuesta"
exit
}
f_verbos="00000_VERBOS.txt"
f_errores="00000_ERRORES.txt"
# CONTROL DE ENTRADA DE VARIABLES y ASIGNACIÓN
if [ $# -lt 2 ]
then
# Reportar uso inapropiado
uso
else
salida=$1
if [ $# -eq 2 ]; then
palabra="$2"
elif [ $# -eq 3 ]; then
palabra="$2 $3"
elif [ $# -eq 4 ]; then
palabra="$2 $3 $4"
elif [ $# -eq 5 ]; then
palabra="$2 $3 $4 $5"
fi
# echo "Palabra es #$palabra#"
fi
# CONSULTA DEL SERVIDOR de la RAE simulando ser uno de los diversos navegadores posibles
navegador=(
"Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:15.0) Gecko/20100101 Firefox/15.0.1"
"Mozilla/5.0 (Windows NT 10.0; WOW64; rv:77.0) Gecko/20100101 Firefox/77.0"
"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:77.0) Gecko/20190101 Firefox/77.0"
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.75.14 (KHTML, like Gecko) Version/7.0.3 Safari/7046A194A"
)
rnd=`echo $(($RANDOM%${#navegador[@]}))` # Elegimos un navegador al azar
# Hacemos la petición a la web de la RAE
curl -s --user-agent "${navegador[$rnd]}" https://dle.rae.es/"$palabra" > ./"$palabra.html"
# PROCESAMOS EL ARCHIVO OBTENIDO (Cortamos, retiramos lo innecesario, etc)
# Si se trata de un verbo, quitar las conjugaciones
id_conjugacion=""
esunverbo=`grep -c "$id_conjugacion" ./"$palabra.html"`
if [ $esunverbo -gt 0 ]
then
echo "$palabra es un verbo" >> $f_verbos
# ELIMINAMOS la(s) CONJUGACIÓN(ES)
sed -i "/${id_conjugacion}/d" ./"$palabra.html"
fi
# Si tiene más de una acepción (Calcular cuántas después de saber si es un verbo)
id_acepcion=""
num_acepciones=`grep -c "$id_acepcion" ./"$palabra.html"`
# Si no tiene acepciones, la palabra no existe. No continuamos.
if [ $num_acepciones -eq 0 ]
then
echo "$palabra no se ha encontrado en la RAE" >> $f_errores
rm "./$palabra.html"
exit
fi
# PARTIR en $num_acepciones EL FICHERO $palabra.html"
# acepciones y acepciones_fin son 2 arrays de líneas PRECISO CONVERTIRLOS a cortes[]
acepciones=`grep -n "$id_acepcion" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'`
c=0
for i in $acepciones
do
let cortes[$c]=$(($i))
let c=$(($c+1))
done
acepciones_fin=`grep -n "$id_acepcion_fin" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'`
c=0
for i in $acepciones_fin
do
let cortes_fin[$c]=$(($i))
let c=$(($c+1))
done
# GENERA FICHEROS palabra.X.html por cada ACEPCIÓN
for (( i=0; i<$num_acepciones; i++ ))
do
# echo "El comienzo del corte está en ${cortes[$((i))]}"
# echo "El fin del corte está en ${cortes_fin[$((i))]}"
sed "${cortes[$((i))]},${cortes_fin[$((i))]} !d" "./$palabra.html" > "./$palabra.$i.html"
# Distintas salidas del programa, en función de la variable "salida"
if [ $salida -gt 0 ] # Salida a modo TXT
then
w3m "./$palabra.$i.html" > "./$palabra.$i.txt"
if [ $salida -gt 1 ] # En una sóla línea
then
sed ':a;N;$!ba;s/\n/ /g' "./$palabra.$i.txt"|sed 's/ / /g' > "./$palabra.$i.1linea"
fi
fi
done
# BORRAR indica si dejar o no los archivos que no se deseen como salida
BORRAR=1
if [[ $BORRAR -eq 1 ]] && [[ $salida -gt 0 ]]
then
rm "./$palabra."*html
if [ $salida -eq 2 ]
then
rm "./$palabra."*txt
fi
fi
# SALIDA FORZADA
exit
Las primeras pruebas las he realizado con la palabra palabra, como debe ser.
buscaenrae.sh 2 palabra
El hueso
el hueso
el hueco hueso
el huero hueso hueco
el huevo huero hueso hueco
el huego huevo huero hueso hueco
el huero hueso hueco huevo
el hueco huero hueso
el hueso hueco
el hueso
Responderle
Soy malísimo con el leísmo/laísmo… y suelo dudar más de lo aceptable para alguien que se dedica a las letras, a correcciones ortotipográficas en esta incipiente editorial a la que ahora mismo sólo denomino Gabinete Literario de Clave 53. Así que cuando el autocorrector del ordenador me subrayó mi «responderle» como error y me sugirió cambiarlo por responderla/lo… me encontré con la duda y tuve que acudir a buscarlo en Internet. (Me avergüenza reconocerlo)

Afortunadamente, tal como yo había supuesto, no es complemento directo de la oración (que sería la respuesta dada, no el destinatario de la misma), así que debía ser LE.
Me sentí algo orgulloso de no haberme equivocado esta vez. Pero seguro que no será la última que tenga que recurrir a buscar para aclararme. «shame on me»
Flecos
Quedan flecos
que son flechas
como flemones
flatulentos.
Quedan flecos
flebíticos
que inflaman fequillos
fletaneros.
Quedan flecos
que son flexiones
irreflexivas con alma de fletán
flexible.
Quedan flecos
en el flexómetro de mi inquietud
flemática con arcos de metal
flexuoso.
Quedan flecos
en ángulos flechados
sobre la fleja del rinoceronte
fletador.
Quedan flecos
por mi alergia al fleo
y su pijama fexibilizador
sobre el flete.
Quedan flecos
que se mueren en un fletante
y cadencioso flexo
sordo y flemudo.
Quedan flecos
sin flejar
en aquel horizonte fletamento
que vimos flexionar.
Quedan flecos
pero pocos y flectados
en la flechería
de nuestro flegmático fleto sin flegma ni flor inapropiada.
Amorfo
aeriforme, aloforma, anatiforme, anseriforme, apterigiforme, arboriforme, ardeiforme, autotransformador, biforme, bioinformático, ca, calamiforme, caliciforme, campaniforme, canceriforme, caradriforme, carniforme, casuariforme, catartiforme, cauliforme, ciconiforme, claviforme, cloroformar, cloroformización, cloroformizar, cloroformo, coleriforme, columbiforme, conformador, conformar, conforme, conformemente, conformidad, conformismo, conformista, coniforme, conquiforme, contrainforme, contrarreforma, cordiforme, corniforme, crateriforme, cruciforme, cuadriforme, cuculiforme, cuneiforme, dactiliforme, deformable, deformación, deformador, ra, deformante, deformar, deformatorio, ria, deforme, deformidad, deiforme, dendriforme, desconformar, desconformidad, desformar, desinformación, desinformar, digitiforme, disconforme, disconformidad, disformar, disforme, disformidad, diversiforme, ensiforme, epileptiforme, escamiforme, escutiforme, esfenisciforme, espiciforme, espongiforme, esteliforme, estrigiforme, estrucioniforme, falciforme, falconiforme, filiforme, flabeliforme, forma, formable, formación, formador, ra, formadura, formaje, formal, formaldehido, formaleta, formalete, formalidad, formalina, formalismo, formalista, formalización, formalizar, formalmente, formalote, ta, formante, formar, formatear, formateo, formativo, va, formato, formatriz, -forme, formenterano, na, formero, formiato, formica, formicante, formícido, da, formidable, formidar, formidoloso, sa, formol, formón, formoseño, ña, formulación, formular, formulario, ria, formulismo, formulista, fungiforme, fusiforme, galliforme, gaseiforme, gruiforme, inconformarse, inconforme, inconformidad, inconformismo, inconformista, indeformable, información, informado, informador, ra, informal, informalidad, informalmente, informante, informar, informático, ca, informativista, informativo, va, informatización, informatizar, informe, informidad, informulable, infundibuliforme, irreformable, lariforme, lotiforme, malformación, malinformar, mamiforme, multiforme, multiplataforma, papiriforme, paseriforme, pectiniforme, pelecaniforme, performance, periforme, piriforme, pisciforme, pisiforme, plataforma, pleuronectiforme, poliforme, preformación, preformismo, preformista, proforma, proteiforme, psitaciforme, reforma, reformable, reformación, reformado, da, reformador, ra, reformar, reformativo, va, reformatorio, ria, reformismo, reformista, reiforme, reniforme, sacciforme, semiforme, transformable, transformación, transformacional, transformador, ra, transformamiento, transformar, transformativo, va, transformismo, transformista, trasformable, triforme, tubuliforme, unciforme, uniformado, da, uniformador, ra, uniformar, uniforme, uniformemente, uniformidad, uniformizar, vermiforme, yodoformo
¿Fluye el tiempo o influye?
¿Fluye el fluido tiempo o es la vida un fluido en el cauce espacio-tiempo?
Desde el punto de vista relativista-mecano-cuántico (o eso), sería la segunda opción la respuesta a esta pregunta que quizá está absurdamente formulada, pues andan algo indefinidas las palabras tiempo y vida, e incluso cauce.
Así que no sé si merece la pena responder a estas cuestiones o tan sólo formularlas para divertirnos un rato jugueteando con el lenguaje.
Como en esta composición visual que relaciona palabras del mismo campo semántico y que hacen una velada referencia a esa gripe, «flu» en inglés, que nos tiene responsablemente confinados.

Conjugación del verbo Destruir
Y cuándo pase esto… ¿Seguiremos dejando que destruyan nuestro planeta?
Verbo Destruir:
- yo no destruyo
- tú no destruyes
- él o ella no destruyen (salvo excepciones)
- nosotros y nosotras nunca destruimos
- vosotros y vosotras jamás destruís
- ellos (y algunas veces ellas) destruyen
