Bien, muy interesante lo que comentas, hecho de menos este tipo de debates, ya que yo soy un lingüísta metido a SEO jeje. En cuanto a los deícticos o señaladores son difíciles para el algoritmo de Google, ya que la lengua es muy ambigua y los deícticos son usados constantemente como determiantes, etc.
Que Google sea capaz de interpretar la semántica de la web es algo sencillo, pero interpretar la anáfora y la catáfora diría que está a años luz. ¿Por qué? Porque son mecanismos que solo se pueden entender en relación con un contexto determinado. Así, un elemento anafórico o catafórico (es lo mismo en distintas posiciones) no solamente puede sustituir a una palabra o a una expresión, sino que puede sustituir a oraciones subordinadas, varias oraciones complejas, párrafos o incluso un texto entero. Es un debate muy interesante, pero yo creo que todavía hay muchas cuestiones de la lengua que se le escapan a Google.
Por ejemplo, nos encontramos con que las oraciones estructuradas gramaticalmente de forma más simple parecen posicionar mejor. Me refiero a la estructura tradicional de sujeto+verbo+complemento y poca subordinación. También le gusta a Google poco la pasiva o la pasiva refleja. Esto es en sí de lógica, pero uno lo puedo comprobar analizando post posicionados en las primeras posiciones. También el famoso plugin Yoast usa esa lógica.
Lo mismo ocurre con los famosos conectores, parece que Google los tiene muy en cuenta como elementos de cohesión gramatical. ¿Por qué? porque es una forma automática de poder predecir si un post está bien escrito. Es más, cuando uno aprende una segunda lengua el dominio de los conectores te soluciona bastante...
Y bueno... hay mucho para comentar y hablar que puede ser interesante.
A veces ocurre que,
lo que ayer era imposible, hoy resulta inevitable (o la teoría del imprevisto inevitable).
Google en el campo de la semántica lo tiene todo ganado: Otorga un valor semántico del concepto mismo a sus consituyentes léxicos (por latencia, estructuras, marcadores, incluso por el uso morfemático de elementos distinción de plural, sufijos que indican estados abstractos como bondad, maldad, etc... todo ello Google es ya capaz de interpretarlo)
En el concepto de "definición semántica" de Google hemos de entender un concepto más amplio al de la lingüística (o quizá no)Para Google el hecho semantico se infiere por el valor del significado, pero también por el contexto, por la segmentación de búsquedas e incluso por el html de cada página.
Ejemplo:
Si buscas el concepto de "bar", estando en Madrid, "Google te localizará los lugares para tomar algo en Madrid"y los más cercanos ( vemos como el contexto define o determina el resultado, igual que en la comunicación.)
Por otra parte, hace unos años era impensable que las estructuras html tuviesen carga semántica, y ahora son elementos que definen un valor interpretativo (el head, o el aside, o el h1, o el h2, son marcadores estructurales, pero también elementos con valor semántico para Google)
Tres elementos: mensaje/texto + contexto/ubicación +estructuras/constituyentes y todo imbricado por la significación en su conjunto de lo que queremos buscar y se nos indexa (casi siempre coincide con lo buscado, es por ello la prevalencia semántica).
Texto-contexto y constituyentes ( Alarcos Llorach estaría pletórico, y todo el estructuralismo, en general. También fui lingüísta... filólogo, más bien).
La cuestión es cómo ls "constituyentes" se articulan como la gramática lingüística y cómoadquieren un valor profundo h1: indica letra, pero también relevancia, frente a h2, h3
De esta manera, elementos lingüísticos deípticos son cada vez más importantes y recurrentes para google, porque los asigna un valor profundo. De hecho, hace años, cuando redactaba textos vimos los textos con estructuras lingüísticas que requieren dos períodos (condicionales, por ejemplo, o elementos conectores como ahora-después, etc, posicionaban mucho mejor que otros más técnicos e impersonales.
El valor profundo de los deipticos ya no es solo coherencia, denota una estructura formal, pero una referencia semántica, un elemento nos ha de llevar al otro necesariamente (de igual modo que un enlace nos tiene que llevar de A hasta el punto B)
Te hablo de un futuro (8, 10 años) para que elementos como los que nos ocupan, adquieran un valor profundo y trascendental para Google, (igual que lo han ido asumiendo las etiquetas html antes comentadas).
Es solo tiempo. En algunos círculos ya se habla de este tema, por imposible que hoy nos parezca.
Hoy día esos "conectores" que tu citas tienen mero valor estructural y de coherencia para Google, está claro, pero el proceso es que adquieran valor en si mismo a modo de "enlace sintagmático" y se doten de valor, por muy imposible o complicado que nos parezca, porque, a modo de colofón, te diré que, a veces, aquello más imposible se torna inevitable.