Cierto desconcierto

abierto, ta/ acierto/ aliabierto, ta/ boquiabierto, ta/ cierto, ta/ concierto/ corniabierto, ta/ cubierto/ desacierto/ desconcierto/ descubierto, ta/ desierto, ta/ despierto, ta/ dispierto, ta/ encubierto, ta/ entreabierto/ incierto, ta/ macroconcierto/ maniabierto, ta/ patiabierto, ta/ perniabierto, ta/ piernabierto, ta/ reabierto, ta/ recubierto, ta/ redescubierto, ta/ semiabierto, ta

El otro día en un taller de poesía alguien usó la palabra «descubierto» y me quedé con ganas de pasarle las palabras en el DLE que terminasen en «bierto», pero eran realmente pocas, así que me decidí por una búsqueda de aquellas que terminan en «ierto» que son unas pocas más: 26.

Ahí están.

Dictionary of the Spanish language Text Analysis

El 20 de agosto de este «peculiar» 2020 recibí un simpático correo electrónico de un hombre llamado «Germán Andrés Segura Tinoco» que me decía:

Buscando en Internet, encontré en su website el diccionario de la RAE en modo texto plano, el cual me pareció genial y quisiera usarlo en un proyecto personal (sin fines de lucro) y publicar el resultado en mi GitHub, en donde tengo mis proyectos de informática públicos.

Por lo tanto, quería preguntarle, ¿cuál es la forma correcta de citarlo o de darle agradecimientos?

No es la primera vez que me pasa algo así desde que realicé el trabajo de recopilar todas las palabras (tecleándolas) del diccionario de la RAE para aquel, lejano ya, proyecto de Isidoro Valcárcel Medina. Sin ir más lejos, el año pasado una persona desde Chile me decía que lo estaba usando para «enseñar a hablar» a una máquina. Así como la gran colaboración que realicé dentro del interesantísimo proyecto de Marta PCampos 1914-2014 sobre las palabras que habían desaparecido del diccionario en esos 100 años. Su precioso trabajo que yo denomino «Palabras Muertas».

Yo le respondí cortésmente con un email ese mismo día diciéndole:

Por supuesto eres libre de usarlo en un proyecto personal sin ánimo de lucro o, incluso, remunerado. Son las palabras de la RAE… es decir, de todos, que yo tan sólo he tecleado (ante la imposibilidad de conseguir una versión digital).

Puedes citarme como te dé la gana, pero agradecería que citases mi nombre y website:
Giusseppe Domínguez https://www.giusseppe.net

Te envío, no obstante, una entrada del blog con una versión lo más actualizada posible (en Mega) y no me responsabilizo de posibles errores… que voy corrigiendo, pero que seguro que alguna quedará. Si necesitas algún tipo de «sección» del mismo o alguna cosa curiosa… puedes decírmelo y si tengo ocasión, cuenta conmigo.

Un cordial saludo y hasta pronto,
Giusseppe

Fue muy bonito e interesante encontrarse en dónde había utilizado esas palabras y para qué: un análisis estadístico de las palabras en español, además de su gentileza a la hora de citarme en varios lugares agradeciéndome mi contribución (que siempre tiendo a minimizar, pues las palabras son públicas).

Buenas tardes, estimado Giusseppe,

Muchas gracias por su respuesta.

Le comparto el link a la página principal del proyecto en el que estoy trabajando, en donde realizo el agradecimiento a usted (en la sección Acknowledgment), con link a su website.
https://ansegura7.github.io/DSL_Analysis/

También le comparto el resultado del análisis descriptivo en el que estoy trabajando. Agradecería sus comentarios al respecto.
https://ansegura7.github.io/DSL_Analysis/pages/dsl_text_analysis.html
Próximamente, estaré compartiendo los resultados por Twitter. Por lo tanto, agradecería si me indica el nombre de usuario de su cuenta Twitter, para poder mencionarlo.

Una vez más, muchas gracias por compartir y recopilar el dataset del DLE.

Saludos cordiales,
Andrés Segura Tinoco

Me resulta simpático que llamen «dataset» al conjunto o listado de las palabras que recoge la RAE en su DLE. Los enlaces del proyecto de Andrés son fantásticos y es un trabajo divertido que seguro que además alguien considera útil.

En su proyecto mezclaba dos de mis grandes pasiones: la programación y el lenguaje, cosa que suelo hacer con frecuencia y que, próximamente, haré aún más. Así que estuve cotilleando con suma atención hasta que creí que podía hacerle una sugerencia útil, además de agradecerle su agradecimiento (entrando en un curioso bucle)

Me alegra saber que te sirve el material recopilado.

He estado ojeando tu proyecto y tiene una pinta estupenda. Me encantan los análisis y tu codificación es muy limpia y bien comentada.

Como única sugerencia (no muy difícil de hacer) es la de escribir todas las frases del análisis en un array (o un archivo externo) que puede modificarse sencillamente para traducciones a otros idiomas. Me explico, por ejemplo, en la parte del código:

"source": [
  "# Show results\n",
  "n_words = len(word_dict)\n",
  "print('Total of different words: %d' % n_words)"
]

podrías sustituir el print por algo así como:

"print('%s: %d' % msg_total_words[i], n_words)"

y tener un array de cadenas msg_total_words[LANGUAGES] o algo similar… (disculpa mi escaso conocimiento de python)

Es sólo una insignificante sugerencia que, seguramente, se puede hacer mejor que como te sugiero. (Leyendo los textos/mensajes de un archivo idiomático, por ejemplo)

Quizá me ha llamado la atención especialmente por el hecho de que no esté en español el resultado, lo que comprendo desde el punto de vista de la divulgación, pero también me resulta paradójico siendo que se habla sobre el español… 😉

Muchísimas gracias por la atribución y espero que no te molesten mis sugerencias.

Un cordial saludo,
Giusseppe

PS: No uso Twitter. Tengo cuenta de Facebook e Instagram, just in case…
https://www.facebook.com/giusseppe.dominguez (perfil personal)
https://www.facebook.com/giusseppedelaaalaz (página «oficial»)
https://www.instagram.com/giusseppe.dominguez

Y en último agradecimiento, me escribió unos días después con los resultados que estaba obteniendo para hacerme partícipe de su publicación. (Lo que es de agradecer).

Estimado Giusseppe,

Muchas gracias por tu sugerencia. Me parece súper válida y útil para mayor y mejor divulgación del material publicado. La tendré en cuenta para este y futuros proyectos.

Aprovecho el correo y te comento 3 cosas brevemente:
1. Cree un hilo en Twitter publicando algunos de los resultados obtenidos en mi análisis y al final hay un tweet agradeciendo y reconociendo tu aporte con link directo a tu sitio web. Te comparto el enlace al hilo (son solo 8 tweets) por si los quieres revisar: https://twitter.com/seguraandres7/status/1298025632090259458?s=21

2. He hecho algunas correcciones sobre las palabras recopiladas. Encontré como 2 o 3 palabras en donde se acentuaban consonantes en vez de vocales y otros pequeños errores, en donde se invertían letras, sin embargo han sido menos de 10 correcciones hasta el momento. Una vez termine el proyecto, te envío de vuelta el diccionario de palabras, para que puedas actualizar el tuyo, de así considerarlo.

3. Para futuro networking o trabajos, te comparto mi sitio web y mi perfil de Twitter donde constantemente estoy publicando resultados de mis trabajos de investigación personales o académicos. Curiosamente, yo no tengo Facebook. Website: https://ansegura7.github.io/ y usuario de twitter: https://twitter.com/SeguraAndres7

Una vez mas, muchas gracias por recopilar y compartir este dataset tan valioso.

Saludos cordiales,
Andres Segura Tinoco
Telf: +57 3555590546

Actualicé mi diccionario con su revisión incorporada, para poder utilizarlo en nuevos proyectos, pero sé, soy consciente, que seguro que habrá más errores. Quizá por ello en el proyecto «Cocinillas» en el que estoy metido ahora mismo he querido incorporar un «testeador» o comprobador, para saber si la palabra que busco en el diccionario existe o no y, en caso contrario, hacer un listado con todas las palabras erróneas que tengo y poder mejorar mi diccionario en texto plano (aunque espero que la próxima vez que lo actualice pueda incorporar, incluso, todas las definiciones).

Búsqueda de palabras en la RAE en línea de comandos

He fabricado un script (un lote de comandos) de bash shell en Linux para descargar y juguetear con búsquedas en la RAE, ya que resulta complicado pedir que tengan la deferencia de hacerla disponible para el público, como si la RAE fuese un organismo público pagado con dinero público.

Es el paso intermedio entre buscar una palabra y descargarme el diccionario completo palabra a palabra. Ahora toca hacer un pequeño programita que lo invoque para cada una de las palabras que tecleé para el proyecto de Isidoro Valcárcel Medina hace unos años y traiga sus definiciones.

Lo he llamado buscaenrae.sh.

Esta versión está modificada sobre la que publiqué hace unos días para subsanar errores relacionados con las palabras que contienen varias entradas/acepciones (no es lo mismo acepciones que entradas y soy consciente de ello, pero no es importante), así como para retirar las conjugaciones en los verbos.

#!/bin/bash

### FUNCIONES ÚTILES PARA EL PROGRAMA
# uso() Instrucciones del programa y salida en caso de error.
uso () {
  echo "Uso: $0 salida palabra"
  echo -e "\tsalida es un valor númerico que identifica:"
	echo -e "\t[0] para generar un archivo HTML con la respuesta"
	echo -e "\t[1] para generar un archivo TXT  con la respuesta"
	echo -e "\t[2] para generar una línea  TXT  con la respuesta"
  exit
}
f_verbos="00000_VERBOS.txt"
f_errores="00000_ERRORES.txt"

# CONTROL DE ENTRADA DE VARIABLES y ASIGNACIÓN
if [ $# -lt 2 ]
then
  # Reportar uso inapropiado
  uso
else
  salida=$1
  if [ $# -eq 2 ]; then
    palabra="$2"
  elif [ $# -eq 3 ]; then 
    palabra="$2 $3"
  elif [ $# -eq 4 ]; then 
    palabra="$2 $3 $4"
  elif [ $# -eq 5 ]; then 
    palabra="$2 $3 $4 $5"
  fi
  # echo "Palabra es #$palabra#"
fi

# CONSULTA DEL SERVIDOR de la RAE simulando ser uno de los diversos navegadores posibles
navegador=(
  "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:15.0) Gecko/20100101 Firefox/15.0.1"
  "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:77.0) Gecko/20100101 Firefox/77.0"
  "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:77.0) Gecko/20190101 Firefox/77.0"
  "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.75.14 (KHTML, like Gecko) Version/7.0.3 Safari/7046A194A"
)
rnd=`echo $(($RANDOM%${#navegador[@]}))` # Elegimos un navegador al azar
# Hacemos la petición a la web de la RAE
curl -s --user-agent "${navegador[$rnd]}" https://dle.rae.es/"$palabra" > ./"$palabra.html"

# PROCESAMOS EL ARCHIVO OBTENIDO (Cortamos, retiramos lo innecesario, etc)
# Si se trata de un verbo, quitar las conjugaciones
id_conjugacion="
" esunverbo=`grep -c "$id_conjugacion" ./"$palabra.html"` if [ $esunverbo -gt 0 ] then echo "$palabra es un verbo" >> $f_verbos # ELIMINAMOS la(s) CONJUGACIÓN(ES) sed -i "/${id_conjugacion}/d" ./"$palabra.html" fi # Si tiene más de una acepción (Calcular cuántas después de saber si es un verbo) id_acepcion="
" num_acepciones=`grep -c "$id_acepcion" ./"$palabra.html"` # Si no tiene acepciones, la palabra no existe. No continuamos. if [ $num_acepciones -eq 0 ] then echo "$palabra no se ha encontrado en la RAE" >> $f_errores rm "./$palabra.html" exit fi # PARTIR en $num_acepciones EL FICHERO $palabra.html" # acepciones y acepciones_fin son 2 arrays de líneas PRECISO CONVERTIRLOS a cortes[] acepciones=`grep -n "$id_acepcion" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'` c=0 for i in $acepciones do let cortes[$c]=$(($i)) let c=$(($c+1)) done acepciones_fin=`grep -n "$id_acepcion_fin" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'` c=0 for i in $acepciones_fin do let cortes_fin[$c]=$(($i)) let c=$(($c+1)) done # GENERA FICHEROS palabra.X.html por cada ACEPCIÓN for (( i=0; i<$num_acepciones; i++ )) do # echo "El comienzo del corte está en ${cortes[$((i))]}" # echo "El fin del corte está en ${cortes_fin[$((i))]}" sed "${cortes[$((i))]},${cortes_fin[$((i))]} !d" "./$palabra.html" > "./$palabra.$i.html" # Distintas salidas del programa, en función de la variable "salida" if [ $salida -gt 0 ] # Salida a modo TXT then w3m "./$palabra.$i.html" > "./$palabra.$i.txt" if [ $salida -gt 1 ] # En una sóla línea then sed ':a;N;$!ba;s/\n/ /g' "./$palabra.$i.txt"|sed 's/ / /g' > "./$palabra.$i.1linea" fi fi done # BORRAR indica si dejar o no los archivos que no se deseen como salida BORRAR=1 if [[ $BORRAR -eq 1 ]] && [[ $salida -gt 0 ]] then rm "./$palabra."*html if [ $salida -eq 2 ] then rm "./$palabra."*txt fi fi # SALIDA FORZADA exit

Las primeras pruebas las he realizado con la palabra palabra, como debe ser.

buscaenrae.sh 2 palabra

Responderle

Soy malísimo con el leísmo/laísmo… y suelo dudar más de lo aceptable para alguien que se dedica a las letras, a correcciones ortotipográficas en esta incipiente editorial a la que ahora mismo sólo denomino Gabinete Literario de Clave 53. Así que cuando el autocorrector del ordenador me subrayó mi «responderle» como error y me sugirió cambiarlo por responderla/lo… me encontré con la duda y tuve que acudir a buscarlo en Internet. (Me avergüenza reconocerlo)

Afortunadamente, tal como yo había supuesto, no es complemento directo de la oración (que sería la respuesta dada, no el destinatario de la misma), así que debía ser LE.

Me sentí algo orgulloso de no haberme equivocado esta vez. Pero seguro que no será la última que tenga que recurrir a buscar para aclararme. «shame on me»

Flecos

Quedan flecos
que son flechas
como flemones
flatulentos.

Quedan flecos
flebíticos
que inflaman fequillos
fletaneros.

Quedan flecos
que son flexiones
irreflexivas con alma de fletán
flexible.

Quedan flecos
en el flexómetro de mi inquietud
flemática con arcos de metal
flexuoso.

Quedan flecos
en ángulos flechados
sobre la fleja del rinoceronte
fletador.

Quedan flecos
por mi alergia al fleo
y su pijama fexibilizador
sobre el flete.

Quedan flecos
que se mueren en un fletante
y cadencioso flexo
sordo y flemudo.

Quedan flecos
sin flejar
en aquel horizonte fletamento
que vimos flexionar.

Quedan flecos
pero pocos y flectados
en la flechería
de nuestro flegmático fleto sin flegma ni flor inapropiada.

Amorfo

aeriforme, aloforma, anatiforme, anseriforme, apterigiforme, arboriforme, ardeiforme, autotransformador, biforme, bioinformático, ca, calamiforme, caliciforme, campaniforme, canceriforme, caradriforme, carniforme, casuariforme, catartiforme, cauliforme, ciconiforme, claviforme, cloroformar, cloroformización, cloroformizar, cloroformo, coleriforme, columbiforme, conformador, conformar, conforme, conformemente, conformidad, conformismo, conformista, coniforme, conquiforme, contrainforme, contrarreforma, cordiforme, corniforme, crateriforme, cruciforme, cuadriforme, cuculiforme, cuneiforme, dactiliforme, deformable, deformación, deformador, ra, deformante, deformar, deformatorio, ria, deforme, deformidad, deiforme, dendriforme, desconformar, desconformidad, desformar, desinformación, desinformar, digitiforme, disconforme, disconformidad, disformar, disforme, disformidad, diversiforme, ensiforme, epileptiforme, escamiforme, escutiforme, esfenisciforme, espiciforme, espongiforme, esteliforme, estrigiforme, estrucioniforme, falciforme, falconiforme, filiforme, flabeliforme, forma, formable, formación, formador, ra, formadura, formaje, formal, formaldehido, formaleta, formalete, formalidad, formalina, formalismo, formalista, formalización, formalizar, formalmente, formalote, ta, formante, formar, formatear, formateo, formativo, va, formato, formatriz, -forme, formenterano, na, formero, formiato, formica, formicante, formícido, da, formidable, formidar, formidoloso, sa, formol, formón, formoseño, ña, formulación, formular, formulario, ria, formulismo, formulista, fungiforme, fusiforme, galliforme, gaseiforme, gruiforme, inconformarse, inconforme, inconformidad, inconformismo, inconformista, indeformable, información, informado, informador, ra, informal, informalidad, informalmente, informante, informar, informático, ca, informativista, informativo, va, informatización, informatizar, informe, informidad, informulable, infundibuliforme, irreformable, lariforme, lotiforme, malformación, malinformar, mamiforme, multiforme, multiplataforma, papiriforme, paseriforme, pectiniforme, pelecaniforme, performance, periforme, piriforme, pisciforme, pisiforme, plataforma, pleuronectiforme, poliforme, preformación, preformismo, preformista, proforma, proteiforme, psitaciforme, reforma, reformable, reformación, reformado, da, reformador, ra, reformar, reformativo, va, reformatorio, ria, reformismo, reformista, reiforme, reniforme, sacciforme, semiforme, transformable, transformación, transformacional, transformador, ra, transformamiento, transformar, transformativo, va, transformismo, transformista, trasformable, triforme, tubuliforme, unciforme, uniformado, da, uniformador, ra, uniformar, uniforme, uniformemente, uniformidad, uniformizar, vermiforme, yodoformo

¿Fluye el tiempo o influye?

¿Fluye el fluido tiempo o es la vida un fluido en el cauce espacio-tiempo?

Desde el punto de vista relativista-mecano-cuántico (o eso), sería la segunda opción la respuesta a esta pregunta que quizá está absurdamente formulada, pues andan algo indefinidas las palabras tiempo y vida, e incluso cauce.

Así que no sé si merece la pena responder a estas cuestiones o tan sólo formularlas para divertirnos un rato jugueteando con el lenguaje.

Como en esta composición visual que relaciona palabras del mismo campo semántico y que hacen una velada referencia a esa gripe, «flu» en inglés, que nos tiene responsablemente confinados.

Esto no es una broma