Vistas de página en total

viernes, 19 de julio de 2013

Dos investigadores ganan la Competición Internacional de Detección de Textos Plagiados


Diego Antonio Rodríguez y José Manuel Martín
El doctorando, Diego Antonio Rodríguez Torrejón, y el profesor del Departamento de Tecnología de la Información, José Manuel Martín Ramos, han obtenido el primer puesto con un novedoso sistema de reconocimiento de texto plagiado, que ha destacado en velocidad y eficacia con respecto a sus competidores. Este sistema ha sido capaz de realizar la comparación de más de 5.000 pares de documentos con distintos tipos de plagio camuflado (traducciones sucesivas, resúmenes, reescritura con sinonimia, enriquecimiento del texto, etc.), detectando el 76% del plagio con una precisión del 90% en apenas 5 segundos, lo que ofrece un gran potencial.
La competición, está enmarcada dentro del Congreso 'Conference and Labs of the Evaluation Forum', de carácter internacional, en que se evalúan los distintos avances en las tecnologías de la información multilingües y multimodales (texto, audio, imagen, etc.). Para ello, cada año se proponen nuevos retos como competiciones en las que se plantean y evalúan las distintas soluciones a los problemas propuestos.
PAN Workshop and Competition, es una iniciativa que promueve la Detección de Plagio, de Autoría y el Mal Uso del Software Social mediante competiciones. La de detección de plagio es la más madura de todas y por ello la de más dificultad para innovar, en la que José Manuel y Diego Antonio han obtenido el primer puesto, destacando en la tarea de alineamiento de texto (identificación) en sus dos parámetros evaluables: la eficacia y la eficiencia, resaltando en esta última por ser al menos 4 veces más rápida que cualquier otra propuesta de la competición y 5 veces más eficaz que el segundo clasificado. 
Hay que indicar que estas medidas se obtienen a partir del promedio de los caracteres (letras) de los documentos analizados, por lo que la efectividad del sistema para detectar la existencia o no de plagio sin equivocarse, es muy superior a la que muestra la competición.
CANALUHU

Expertos de América Latina analizan respuestas a la trata de personas

En los últimos años los países de América Latina han pasado de ser origen de la trata de personas o de formas de esclavitud moderna, a convertirse en tránsito y destino de las víctimas.
Ese delito sigue siendo una asignatura pendiente para los gobiernos, subrayaron los participantes del III Congreso Latinoamericano sobre el tema celebrado en Bogotá que reunió a expertos en la materia para elaborar respuestas efectivas para combatir el flagelo.
El encuentro, organizado por la Oficina de Naciones Unidas contra la Droga y el Delito (UNODC) en Colombia, contó con la participación especial de la relatora de la ONU sobre la trata y el tráfico de personas, Joy Ngozi Ezeilo.
Una de las participantes fue Jessica Belardes del Centro de Capacitación y Servicio para la Mujer, CECASEM en Bolivia.
“A nivel Sudamérica se ha notado que Argentina es uno de los países que más reporta casos de trata de personas, después tenemos el caso de Perú, después de Colombia. Depende la característica, hay países que son de origen, que expulsan a las víctimas, otros que solamente son de paso, y otros que son obviamente un país de destino”.
Según datos circulados durante la reunión los casos más frecuentes son de trata con fines de explotación sexual y laboral, que incluyen empleos en el sector textil, de la minería o agrícola. Le sigue una alarmante proliferación de trata para la mendicidad infantil y para el servicio doméstico.
ONU

miércoles, 17 de julio de 2013

De almóndigas y otras «aberraciones»

Artículo de fábula escrito por Yolanda Gándara, y publicado en Jot Down Cultural Magazine

Real Academia Española (23)
En 2014 se presentará la vigésima tercera edición del Diccionario de la Real Academia Española, aunque desde hace tiempo podemos conocer algunas de las novedades que presentará gracias a la versión en línea. Como suele ocurrir con las obras de la Academia, el Diccionario es fuente de encarnizadas polémicas. Desde el momento mismo de su fundación hasta hoy, a la RAE nunca le han faltado detractores ilustres; a ellos se han ido sumando espontáneos de todos los campos del saber y del desconocer, que, gracias a Internet, nos ofrecen su opinión en blogs, foros, revistas digitales y redes sociales, dando lugar a artículos, debates, pifias y grupos de señoras que se sublevan contra la RAE.
Examinando sus reacciones en la red, la actitud que se percibe en los hablantes es, en general, de un autoproclamado conservadurismo, en ocasiones un tanto inopinado, llegando a considerar la Academia como una institución nociva para la salvaguardia de la lengua por su carácter indulgente, por no decir macarra, a la hora de consentir vulgarismos, barbarismos, neologismos y otros presuntos enemigos del buen uso. Esta postura nace del desconocimiento de la naturaleza del diccionario, unido a la asignación de un poder materializante y legitimador: lo que está en el diccionario existe, es legal y pienso usarlo. Es habitual encontrar expresiones como «ahora podemos decir» haciendo referencia a la inclusión de voces o, por el contrario, reclamaciones sobre términos no reflejados, con la finalidad de reconocer su existencia y demostrarla con papeles. Resulta paradójico que muchos hablantes declarados en rebeldía reconozcan con sus demandas la autoridad del diccionario más allá de sus propias pretensiones.
El DRAE es un diccionario general y no puede contener todo el léxico de la lengua. No abarca todas las palabras formadas por composición o derivación y muchas otras que, aun ateniéndose a las reglas y por tanto siendo correctas desde el punto de vista lingüístico, sencillamente, no caben. Incluye, y así lo ha hecho desde su primera edición, los vulgarismos, usos coloquiales, dialectales, arcaísmos, etc., más extendidos y frecuentes, indicando su naturaleza.
Hay que tener en cuenta que, además de la normativa, el DRAE tiene una función descriptiva de la lengua; es una herramienta para interpretarla y no puede contener únicamente las palabras cultas. Su misión no es seleccionar las voces que se pueden decir, sino registrar el uso que los hablantes hacen de ellas.
Es un diccionario más amplio y complejo que el Diccionario esencial y otros de carácter divulgativo que no contienen este tipo de entradas que, a partir de su descubrimiento por parte del gran público, causan conmoción:
Probablemente la más popular: ni un día en las redes sociales sin que alguien dé la voz de alarma sobre su aceptación, sembrando el desconcierto y la consiguiente reacción en cadena de desmayos, indignación y ojos sangrando.
En realidad aparece desde la primera edición del Diccionario en 1726 y remite a la entrada albóndiga, en la que se relatan las posibles etimologías y se señala el uso. Hasta la vigésima tercera edición no aparecerán las marcas «desusado» (desus.) y «usado como vulgar» (U. c. vulg.), si bien en el DPD sí aparece la advertencia «no debe usarse la forma almóndiga, propia del habla popular de algunas zonas».
Variante arcaica de toalla, habitual en español antiguo. En el Diccionario desde 1739. Se indica su uso vulgar en el DPD.
COCRETA
Aunque se suele añadir a la lista de ultrajes académicos, tal vez por afinidad con almóndiga, no está registrada en el diccionario. Lamentablemente, en mi opinión. Es una forma documentada y mantuvo con croqueta un pulso que perdió contra todo pronóstico, pues la metátesis es un fenómeno propio de nuestra lengua que ha triunfado en casos como el que veremos a continuación.
Variante antigua y etimológica del latín crocodilus y este del griego κροκόδειλος. Se mantiene la raíz cro- en gallego, euskera, portugués, francés, inglés y alemán. En castellano e italiano sufrió metátesis, siendo la forma «no culta» la que triunfó en estas dos lenguas. Crocodilo aparece en la primera edición del diccionario como forma aconsejada frente a cocodrilo usada esta última «contra los más selectos Autores y Vocabularios», siendo a partir del siglo XVIII cuando se impone.
Aparece en 1734 en el Diccionario con una inquietante descripción que merece la pena rescatar, así como esta estrofa escrita mientras coexistió junto a murciélago.
Tras vos, un alquimista va corriendo,
Dafne, que llaman Sol, ¿y vos tan cruda?
Vos os volvéis murciégalo sin duda,
pues vais del Sol y de la luz huyendo.
Francisco de Quevedo (A Dafne, huyendo de Apolo)
(6)
En el Diccionario desde 1770, al mismo tiempo que así. Actualmente marcado como «vulgar». En los bancos de datos CREA y CORDE está documentado su uso, en algunos casos como imitación del habla popular.
 Consulta: asín, en todos los medios, en CORDE 
 Resultado: 246 casos en 45 documentos.
REAL ACADEMIA ESPAÑOLA: Banco de datos (CORDE) [en línea]. Corpus diacrónico del español. [08/07/13]
 Consulta: asín, en todos los medios, en CREA 
 Resultado: 22 casos en 13 documentos.
REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea]. Corpus de referencia del español actual. [08/07/13]
Estas y otras palabras recogidas como vagamundo, miraglo o agora, tienen en común el haber formado siempre parte del diccionario —y así seguirá siendo mientras no esté terminado el Diccionario histórico a pesar de ser percibidas por algunos usuarios como incorporaciones recientes que respondieran a una relajación de la norma.
El diccionario se limita a registrar su existencia señalando con marcas su calificación o remitiendo a la forma culta. Considerarlas aconsejadas es una interpretación errónea, del mismo modo que la existencia de expresiones malsonantes no implica de ninguna manera que se recomiende su uso en la redacción de correos profesionales o en la descripción en medios de comunicación de lanzamientos a puerta de Sergio Ramos.
Real Academia Española (11)
Otras entradas que provocan indignación son las grafías adaptadas de anglicismos. Generalmente de anglicismos y no de todos los extranjerismos. Según manifiestan algunos usuarios se perciben como un atraso, al considerar más moderno y avanzado escribirlos en inglés. Por el contrario, muchos hablantes aborrecen palabras de variantes de la lengua española que le son ajenas en una actitud que raya la xenofobia. El etnocentrismo es tan acusado en algunos casos como para reducir el perímetro de aceptación al alcance de las orejas y un «no lo había oído en mi vida» se usa frecuentemente como argumento de rechazo. Estas actitudes competen más al estudio sociológico que al lingüístico.
Las adaptaciones gráficas no suponen un empobrecimiento de la lengua, sino todo lo contrario, y hay miles de ejemplos que ni siquiera se perciben como préstamos al estar plenamente integrados. La incorporación de léxico adquirido es un proceso natural de la lengua para ampliar su vocabulario.
El número de voces que producen alarma es abundante, pero, dado que la mayoría son sugerencias que la Academia propone como solución a dudas planteadas, con el objetivo de integrar vocablos de forma acorde al sistema fonético y ortográfico español y que los hablantes pueden hacer uso de ellas u optar por el extranjerismo crudo destacado con relieve tipográfico, no merece la pena detenerse en este punto más que para comentar algunas de las más controvertidas.
Está en el diccionario desde 1984, al mismo tiempo que whisky, y tiene escaso seguimiento en comparación al anglicismo crudo.
Consulta: güisqui, en todos los medios, en CREA 
 Resultado: 118 casos en 55 documentos.
REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea]. Corpus de referencia del español actual. [08/07/13]
El rechazo que provoca güisqui no tiene parangón en coñac, sake, vodka, ginebra, ron o vermut, todos ellos extranjerismos integrados sin salir del campo semántico de las bebidas alcohólicas, incorporados a nuestra lengua en distintos momentos de la historia. La Ortografía de la lengua española de 2010 propone wiski.
La marca Am. indica que se trata de un uso restringido en América. Como explica el DPD, en gran parte de Hispanoamérica se usa exclusivamente la denominación inglesa para el pantalón vaquero y la grafía adaptada tiene uso documentado. En España se utilizan únicamente las denominaciones vaquero y tejano, de modo que no incumbe su uso.
Al igual que bluyín está marcado su uso en América. La grafía adaptada está muy extendida en el continente desde hace años y existen derivados como jonronear o jonronero. El béisbol es un deporte mucho más popular en América que en España, hecho que sin duda contribuye a la natural incorporación y adaptación de préstamos relacionados.
Consulta: jonrón, en todos los medios, en CREA 
 Resultado: 592 casos en 254 documentos.
REAL ACADEMIA ESPAÑOLA: Banco de datos (CREA) [en línea]. Corpus de referencia del español actual. [08/07/13]
Otro de los aspectos controvertidos son las palabras o acepciones de palabras que hieren la sensibilidad de algunos colectivos. Son clásicos los reproches por acepciones de gitano, gallego o judiada. La próxima edición revisa algunas atendiendo al desuso; para compensar, incluye dos novedades que ya han despertado protestas por su carga machista.
1. m. coloq. Esp. Muslos de una persona, especialmente los de mujer.
(Del dim. de canal).
1. m. coloq. Comienzo de la concavidad que separa los pechos de la mujer tal como se muestra desde el escote.
La Academia siempre ha manifestado que el Diccionario no puede regirse por criterios de corrección política. En su cometido de «notario» no puede intervenir en los usos que los hablantes hacen de las palabras ni desterrar voces inconvenientes.
La lista de palabras motivo de queja es copiosa y sin duda algunas de ellas con fundamento y razón; de hecho, la Unidad Interactiva del Diccionario resuelve en este sentido muchas de ellas.
La vigésima tercera edición del DRAE será la primera que estará a disposición de los usuarios en la red de forma idéntica a su versión en papel, lo que supone una valiosa fuente de información que precisa una interpretación más compleja que otros diccionarios simplificados. Desde que los hablantes han ido conociendo masivamente el Diccionario a través de la red, al tiempo que tenían oportunidad de comentar su contenido, este ha sido motivo de mayores polémicas, lo cual indica un interés por nuestra lengua que merece la pena orientar hacia la investigación mediante las múltiples herramientas y datos de los que disponemos, y, por qué no, dirigir nuestras propuestas argumentadas para mejorar el Diccionario.
Como pretensión personal, la definición de gañán me parece insuficiente para el uso actual. Habrá que recabar pruebas para legitimar su uso y el de su derivado gañanía.

Gañán
Fotografía: Guadalupe de la Vallina
_________________________________________________________________________________________________________
Fuentes:

«pen drive», alternativas en español

La voz inglesa pen drive (o pendrive) es sustituible por expresiones españolas como memoria USB, lápiz de memoria, memoria externa o lápiz USB.
Sin embargo, a propósito de la información proporcionada por Luis Bárcenas al juez Ruz, se pueden ver noticias en las que se emplea el extranjerismo: «El pendrive de Bárcenas fijaría en 8,3 millones el dinero negro del PP», «La documentación  aportada por Luis Bárcenas, recogida en un pendrive cuyo contenido…».
En estos casos, habría sido preferible escribir alguno de los equivalentes en español mencionados: «El lápiz de memoria de Bárcenas fijaría en 8,3 millones el dinero negro del PP», «La documentación  aportada por Luis Bárcenas, recogida en una memoria USB cuyo contenido…».

En caso de emplear la voz inglesa, lo apropiado es escribirla en cursiva o, si no se dispone de ese tipo de letra, entre comillas.

 Semblanza

Los primeros modelos requerían de una batería, pero los actuales usan la energía eléctrica procedente del puerto USB. Estas memorias son resistentes a los rasguños (externos), al polvo, y algunos hasta al agua, factores que afectaban a las formas previas de almacenamiento portátil, como los disquetes, discos compactos y los DVD.
Su gran éxito y difusión les han supuesto diversas denominaciones populares relacionadas con su pequeño tamaño y las diversas formas de presentación, sin que ninguna haya podido destacar entre todas ellas. En España son conocidas popularmente como pinchos o lápices, en otros países como El Salvador, Honduras, México , Colombia y Guatemala son conocidas como memorias, en Venezuela como pendrives y en Costa Rica se le llama popularmente Llave Maya. El calificativo USB o el propio contexto permite identificar fácilmente el dispositivo informático al que se refiere; aunque siendo un poco estrictos en cuanto al concepto, USB únicamente se refiere al puerto de conexión.

Características

Estas memorias se han convertido en el sistema de almacenamiento y transporte personal de datos más utilizado, desplazando en este uso a los tradicionales disquetes y a los CD. Se pueden encontrar en el mercado fácilmente memorias de 1, 2, 4, 8, 16, 32, 64, 128, 256, 512 GB, y hasta 1 TB.1 Las memorias con capacidades más altas pueden aún estar, por su precio, fuera del rango del "consumidor doméstico". Esto supone, como mínimo, el equivalente a 180 CD de 700 MB o 91 000 disquetes de 1440 KiB aproximadamente.

Soporte

Los sistemas operativos actuales pueden leer y escribir en las memorias sin más que enchufarlas a un conector USB del equipo encendido, recibiendo la tensión de alimentación a través del propio conector, de 5 voltios y un consumo de 2,5 vatios como máximo. En equipos algo antiguos (como por ejemplo: los equipos con el Windows 98) se necesita instalar un controlador proporcionado por el fabricante. Las diversas distribuciones GNU/Linux también tienen soporte para estos dispositivos de almacenamiento desde la versión 2.4 del núcleo.

Historia

Lector de tarjetas SD que actúa como memoria USB.

Primera Generación

Las empresas Trek Technology e IBM comenzaron a vender las primeras unidades de memoria USB en el año 2000. Trek vendió un modelo bajo el nombre comercial de Thumbdrive e IBM vendió las primeras unidades en Norteamérica bajo la marca DiskOnKey, desarrolladas y fabricadas por la empresa israelí M-Systems en capacidades de 8 MiB, 16 MiB, 32 MiB y 64 MiB . Estos fueron promocionados como los "verdaderos reemplazos del disquete", y su diseño continuó hasta los 256 MiB. Los modelos anteriores de este dispositivo utilizaban baterías, en vez de la alimentación de la PC.

Segunda Generación

Dentro de esta generación de dispositivos existe conectividad con la norma USB 2.0. Sin embargo, no usan en su totalidad el ancho de banda de 480 Mbit/s que soporta la especificación USB 2.0 Hi-Speed debido a las limitaciones técnicas de las memorias flash basadas en NAND. Los dispositivos más rápidos de esta generación usan un controlador de doble canal, aunque todavía están muy lejos de la tasa de transferencia posible de un disco duro de la actual generación, o el máximo rendimiento de alta velocidad USB.
Las velocidades de transferencia de archivos varían considerablemente. Se afirma que las unidades rápidas típicas leen a velocidades de hasta 30 Mbit/s y escribir a cerca de la mitad de esa velocidad. Esto es aproximadamente 20 veces más rápido que en los dispositivos USB 1.1, que poseen una velocidad máxima de 12 Mbit/s.

Tercera Generación

La norma USB 3.0 ofrece tasas de transferencia de datos mejoradas enormemente en comparación con su predecesor, además de compatibilidad con los puertos USB 2.0. La norma USB 3.0 fue anunciada a finales de 2008, pero los dispositivos de consumo no estuvieron disponibles hasta principios de 2010. La interfaz USB 3.0 especifica las tasas de transferencia de hasta 5 Gbit/s, en comparación con los 40 Mbit/s de USB 2.0. A pesar de que la interfaz USB 3.0 permite velocidades de datos muy altas de transferencia, a partir de 2011 la mayoría de las unidades USB 3.0 Flash no utilizan toda la velocidad de la interfaz USB 3.0 debido a las limitaciones de sus controladores de memoria, aunque algunos controladores de canal de memoria llegan al mercado para resolver este problema. Algunas de estas memorias almacenan hasta 256 GiB de memoria (lo cual es 1024 veces mayor al diseño inicial de M-Systems). También hay dispositivos, que aparte de su función habitual, poseen una Memoria USB como aditamento incluido, como algunos ratones ópticos inalámbricos o Memorias USB con aditamento para reconocer otros tipos de memorias (microSD, m2, etc.).
En agosto de 2010, Imation anuncia el lanzamiento al mercado de la nueva línea de USB de seguridad Flash Drive Defender F200, con capacidades de 1 GiB, 2 GiB, 4 GiB, 8 GiB, 16 GiB y 32 GiB. Estas unidades de almacenamiento cuentan con un sensor biométrico ergonómico basado en un hardware que valida las coincidencias de las huellas dactilares de identificación, antes de permitir el acceso a la información.

 Fundéu BBVA
Wikipedia

Juega Angry hongos