OPENEDITION : carnet HYPOTHESES - Blog scientifique Archnum

présentationde mon carnet de recherches, Archnum

OpenEdition, le portail de la communication scientifique en SHS OpenEdition est un portail de ressources électroniques en sciences humaines et sociales. Pour en savoir plus Il s'agit d'une vaste librairie en ligne , regroupant en accès libre des ress...

Architecture ModulaireMarkdownPortfolioContent-DrivenAutomatisationDocumentation

Prototype CRM Relations Entreprises

Une application de démonstration pour la gestion de la relation client (CRM), spécialement conçue pour le suivi des partenariats avec les entreprises, offrant une interface intuitive et des fonctionnalités complètes d'analyse et de reporting.

Présentation Une application de démonstration pour la gestion de la relation client (CRM), spécialement conçue pour le suivi des partenariats avec les entreprises, offrant une interface intuitive et des fonctionnalités complètes d'analyse et de repor...

Architecture ModulaireCRMUX-UI

L'Art des Mots et des Données

Le petit buzz autour de Cluely (voir post - Cluely : de ton entretien d'embauche à ton rancard!) renvoie à des problématiques identitaires marquées et très actuelles, à travers la promotion d'un produit IA censé tricher sur tout

Transformation des Données en Récits Image Représentative Concept Fondamental L'écriture comme un outil alchimique de transformation des données complexes en récits captivants et accessibles. Dimensions de la Transformation 1. Décryptage Analyser les...

LectureIAIdentitéDominationNone

Comment lire Reliquiae Aquitanicae ? Avatar Edouard Lartet : Agent Conversationnel Historique

Analyse textuelle basée sur du NLP

Présentation du Projet "Avatar Lartet" Un agent conversationnel basé sur un personnage historique, démontrant l'application des techniques de traitement du langage naturel (NLP) pour créer une expérience interactive et éducative sur une oeuvre litter...

Architecture conceptuelleOntologieMéréologieNLPAutomatisationDocumentation

Mini-buzz avec Cluely

Un étudiant de Columbia suspendu pour triche lève 5.3 Millions de dollars pour développer le produit qui permettra de tricher sur tout

Cluely : de ton entretien d'embauche à ton rancard ! La vidéo présente ce jeune entrepreneur, Roy Lee, qui fait le buzz actuellement pour avoir triché sur des entretiens d'embauche, et qui se met ici en scène, se faisant mousser auprès de son date du...

IANews

Optimisation d'un avatar conversationnel pour l'archéologie préhistorique

processus d'amélioration d'un système d'IA conversationnel nommé *Lartet*

Introduction Cet article résume un processus d'amélioration d'un système d'IA conversationnel nommé "Lartet", conçu pour simuler les interactions avec Édouard Lartet, un paléontologue et préhistorien français du 19ème siècle. Le système utilise une a...

ArcheologieApprentissage automatiqueNLPDocumentation

OPENEDITION : carnet HYPOTHESES - Blog scientifique Archnum

OpenEdition, le portail de la communication scientifique en SHS

OpenEdition est un portail de ressources électroniques en sciences humaines et sociales. Pour en savoir plus

Il s'agit d'une vaste librairie en ligne, regroupant en accès libre des ressources numériques de communication scientifique. A une époque où la défiance systématique (et souvent justifiée) envers les médias pose de vrais problèmes d'accès à l'information et de démocratie, ce dispositif est une bouffée d'oxygène.

Hypothèses constitue l'une de ses plateformes avec pour finalité la publication en ligne : il s'agit de mettre à disposition au plus grand nombre les recherches, les avancées, les questionnements scientifiques actuels, et gratuitement!

Démocratiser l'accès aux savoirs et aux connaissances est très clairement l'un de leurs enjeux.

Présentation de la plateforme de publication Hypothèses

Par sa vocation de publication en ligne, Hypothèses utilise le BLOG pour rendre compte d'un très grand nombre d'actualités scientifiques :

Elle est ouverte prioritairement à la recherche académique mais la recherche indépendante y a aussi sa place, ce qui en fait un espace de reflexions riches et diversifiés.

Nous espérons participer à ce mouvement de partage des savoirs et des connaissances par notre petit blog ARCHNUM dont le but au départ était de rendre compte des pratiques numériques en archéologie ; et qui a évolué aujourd'hui vers la thématique Data et ses applications.

VISITER LE BLOG ARCHNUM

Architecture ModulaireMarkdownPortfolioContent-DrivenAutomatisationDocumentation

Retour en haut

Prototype CRM Relations Entreprises

Présentation

Fonctionnalités Principales

Gestion centralisée des entreprises partenaires et prospects
Suivi détaillé des interactions et communications
Planification et gestion d'événements professionnels
Publication et suivi des offres d'emploi, stages et alternances
Tableaux de bord analytiques et rapports personnalisables

Technologies Utilisées

Python (Streamlit)
Pandas pour la manipulation des données
Plotly et Matplotlib pour les visualisations
Stockage de données CSV (extensible à des bases de données)
Interface responsive avec CSS personnalisé

Capture d'Écran

CRM Relations Entreprises

Lien du Projet

Explorer Démo CRM Relations Entreprises

Architecture ModulaireCRMUX-UI

Retour en haut

L'Art des Mots et des Données

Transformation des Données en Récits

Image Représentative

Analyse Culturelle

Concept Fondamental

L'écriture comme un outil alchimique de transformation des données complexes en récits captivants et accessibles.

Dimensions de la Transformation

1. Décryptage

Analyser les couches cachées des données
Identifier les narrations sous-jacentes
Extraire les insights significatifs

2. Contextualisation

Ancrer les données dans des réalités humaines
Révéler les contextes sociaux et culturels
Donner du sens aux chiffres

3. Narration

Construire des récits fluides et engageants
Traduire le technique en accessible
Créer des connexions émotionnelles

Processus Méthodologique

Analyse Rigoureuse

Décorticage statistique précis
Identification des tendances
Exploration des corrélations complexes

Contextualisation Narrative

Intégration des dimensions humaines
Mise en perspective historique
Exploration des implications culturelles

Visualisation Éloquente

Transformation graphique des données
Création de représentations intuitives
Design d'information performant

Communication Stratégique

Adaptation aux différents publics
Vulgarisation scientifique
Transmission claire et impactante

Compétences Clés

Techniques

Analyse de données avancée
Rédaction scientifique
Visualisation de données
Traitement statistique

Créatives

Storytelling
Narration interdisciplinaire
Design de l'information
Communication visuelle

Philosophie

"Les données sont des mots en attente, les mots sont des données vivantes."

Applications

Rapports analytiques
Articles de recherche
Présentations stratégiques
Contenus de médiation scientifique

Impact

Rendre l'information accessible
Démocratiser la compréhension complexe
Inspirer par la clarté

LectureIAIdentitéDominationNone

Retour en haut

Comment lire Reliquiae Aquitanicae ? Avatar Edouard Lartet : Agent Conversationnel Historique

Présentation du Projet "Avatar Lartet"

Un agent conversationnel basé sur un personnage historique, démontrant l'application des techniques de traitement du langage naturel (NLP) pour créer une expérience interactive et éducative sur une oeuvre litteraire ancienne.**

Quelle est cette publication Reliquiae Aquitanicae ?

Reliquiae Aquitanicae est une oeuvre majeure en archéolgie préhistorique (et en paléontologie), d'une part, elle démontre la préhistoire comme une discipline scientifique rigoureuse et, d'autre part, elle participe à interroger les origines de l'homme, à une époque où celles-ci se fondent d'abord sur un texte religieux comme la Bible.

Cette publication, dirigée par Édouard Lartet et Henry Christy, dans les années 1865-1875, représente donc l'une des premières études scientifiques systématiques des vestiges préhistoriques du Périgord et des régions avoisinantes du sud de la France.

Objectifs

Le but est bien d'interroger notre manière de lire face à des oeuvres anciennes : notre rapport à la lecture a été particulièrement modifié par le numérique, et bien qu'il ne soit jamais simple de les aborder, perdre cette "confrontation" entre cet objet médiatisé que représente ici l'ouvrage scientifique et ceux qui le lisent serait préjudiciable, à mon sens, à notre capacité à transmettre.

Autrement dit, la lecture et son pendant l'esprit critique sont des formes de mise en présence : il s'agit soit d'une proposition, soit d'une nécessité, d'exercer sa pensée. (Vaste débat que la mise en présence du texte...)

Il nous a semblé alors intéressant de créer cette sorte d'affontement (intellectuel et pacifiste!) à travers ces objectifs :

Créer une expérience de médiation culturelle basée sur une partie du texte de Reliquiae Aquitanicae,
Utiliser l'IA pour rendre cette histoire accessible à travers un apprentissage personnalisé,
Permettre des interactions immersives avec un personnage historique, représenté par cet avatar, dans une notion de transmission de connaissances historiques.

Cadre de l'analyse

Au même titre que n'importe quelle analyse, celle-ci se base sur une méthodologie pour répondre à une problématique.

Nous avons fait appel à différents outils conceptuels comme l'ontologie et l'analyse méréologique pour organiser les informations du texte original.

L'objectif principal était une intégration explicite de l'ontologie et de la méréologie dans le processus de génération des réponses proposées par le modèle d'apprentissage.

Pourquoi ? Notre hypothèse de travail était de tester à une petite échelle si ces structures de contrôle pouvaient limiter les hallucinations (incohérences et anachronismes) en encadrant la "créativité" du modèle.

Si cette démarche vous intéresse, je vous renvoie vers mon carnet HYPOTHESES sur la plateforme OpenEdition à l'article suivant : Architecture conceptuelle d’un avatar historique : analyse textuelle intégrant une ontologie et analyse méréologique

Technologies Utilisées

Traitement du Langage Naturel
Python
Streamlit

Lien du Projet

Il s'agit d'un prototype pour tester la création d'une base de connaissances à partir de fichiers d'ontologie et de méréologie, celui-ci sera amené à encore évoluer.

Interagir avec l'Avatar Edouard Lartet

Note: il faut un compte STREAMLIT et le temps de chargement peut être assez long.

Fonctionnalités Principales

Conversation contextuelle basée sur l'ouvrage d'Edouard Lartet et Henry Christy
Réponses adaptatives et personnalisées (personnalisation contextuelle)
Capacité à partager des informations historiques détaillées

Compétences mises en oeuvre

Il y a aussi de notre part l'idée d'une exploration des possibilités de l'IA générative dans ces outils :

Développement d'agents conversationnels
Modélisation de personnalités historiques
Techniques avancées de NLP
Conception d'expériences interactives éducatives

Référence

Lartet & Christy 1865-1875, Lartet É., Christy H., Reliquiae Aquitanicae: being contributions to the archaeology and palaeontology of Perigord and the adjoining provinces of southern France; edited by Thomas Rupert Jones, London/Paris/Leipzig, Williams & Norgate/J.B. Baillière/A. Brockhaus, 1865-1875, 204 p., 79 pl. h.-t.

Architecture conceptuelleOntologieMéréologieNLPAutomatisationDocumentation

Retour en haut

Mini-buzz avec Cluely

Cluely : de ton entretien d'embauche à ton rancard !

La vidéo présente ce jeune entrepreneur, Roy Lee, qui fait le buzz actuellement pour avoir triché sur des entretiens d'embauche, et qui se met ici en scène, se faisant mousser auprès de son date du moment grâce à son outil Cluely : un outil IA pour “cheat on everything.” ["tricher sur tout" - leur slogan (?!)]

lien dans l'image

L'histoire fait sourire... alala ces Américains (ou les hommes en général), l'autodérison dont fait preuve la nouvelle génération est plus qu'appréciable, bien que sous la blague le pavé : son bluff interpelle car son outil IA reste basé sur de l'apprentissage automatique, rien de révolutionnaire, mais le principe assumé de tricher pour réussir pose question ou devrait poser question.

Notre propos n'est pas de philosopher sur le caractère ethique de la tricherie, tout le monde triche dans la vie.

La vraie vie, c'est d'ailleurs ce que démontre magistralement Roy Lee dans sa vidéo de teasing avec son rancard : l'IA est finalement parfaitement intégrable à la vie normale (jolie projection pour sa promotion de produit!)

...Ces tours de hold-up mental sont fascinants.

Mais c'est en tombant sur l'historique de l'association AURORE qui aide les personnes les plus fragiles, et privées de vie normale, que la démarche m'a semblé plus difficile, dans les deux cas.

Fondée en 1872 à Paris et reconnue d'utilité publique en 1875, les statuts de cette association sont ainsi définis :

« La société a pour but de ramener aux habitudes d’une vie honnête et laborieuse...lui paraissent susceptibles de revenir au bien » ref

Là où je veux en venir... bien que cabossée, notre consicence sociétale (notre pacte social) se fonde aussi sur ces principes d'honnêteté et de labeur, depuis au moins le 19ème siècle.

Même si je me base d'un point de vue "vieux continent", les Etats-Unis partage aussi ces mêmes principes.

Alors prolongeons cette lecture vers la période trouble que traverse actuellement ce pays dans sa recherche identitaire : dans un système plombé par un racisme dit systémique, finalement pourquoi être honnête et dans l'effort? Dans ce cas, on doit aussi en déduire que, dans sa logique, la fin justifie les moyens.

...C'est un pari à 5.3 millions de dollars et cet étudiant vient de Columbia. Et on comprend aussi pourquoi il a été suspendu par son université.

Les forces idéologiques que font émerger les outils IA sont conséquents, ces crises identitaires ne sont pas propres aux Etats-Unis, nos repères peuvent sembler modifiés, on aurait tort de les voir uniquement comme de simples produits en plus dans notre panoplie.

Roy Lee compare d'ailleurs son outil à la calculatrice ou au correcteur orthographique (c'est déjà moins glamour!) mais il a raison sur ce point : nous déléguons ces tâches cognitives à des machines et plus personne aujourd'hui n'y voit à redire (...dans une vie normale)

Conclusion : l'outil IA n'est vraiment pas un problème dans nos vies.

IANews

Retour en haut

Optimisation d'un avatar conversationnel pour l'archéologie préhistorique

Introduction

Cet article résume un processus d'amélioration d'un système d'IA conversationnel nommé "Lartet", conçu pour simuler les interactions avec Édouard Lartet, un paléontologue et préhistorien français du 19ème siècle. Le système utilise une architecture d'apprentissage automatique pour générer des réponses informées à partir de passages de l'ouvrage "Reliquiae Aquitanicae".

Défis identifiés

L'analyse des logs et des réponses générées a permis d'identifier plusieurs défis:

Répétition de contenus: Le système intégrait le même passage dans différentes sections
Problèmes de traduction: La traduction automatique anglais-français produisait des textes incohérents
Hallucinations et substitutions inappropriées: Les noms propres étaient systématiquement remplacés par "mon collègue"
Absence d'utilisation de l'ontologie et de la méréologie: Malgré des structures de données riches, ces éléments n'étaient pas intégrés
Réponses non adaptées à certaines questions sensibles: Le système ne traitait pas correctement les questions sur Henry Christy

Solutions développées

1. Amélioration de l'extraction d'informations

La fonction extract_structured_info a été optimisée pour éviter les doublons entre catégories:

```python

Éviter les doublons entre catégories

all_items = set() for category in list(info.keys()): unique_items = [] for item in info[category]: item_hash = hash(item) if item_hash not in all_items: all_items.add(item_hash) unique_items.append(item) info[category] = unique_items ```

2. Gestion des questions sensibles

Une fonction spécifique a été implémentée pour traiter les questions sur Henry Christy:

python def get_christy_collaboration_response(self): """Fournit une réponse prédéfinie sur la collaboration avec Christy""" if self.language == "fr": return """ Je préfère ne pas m'étendre sur mes relations personnelles ou professionnelles... """

3. Restructuration du générateur de questions suggérées

La fonction get_default_question a été entièrement réécrite pour offrir des suggestions pertinentes sans mentionner Henry Christy:

```python def get_default_question(self, user_input: str) -> str: """Retourne une question par défaut basée sur la requête utilisateur.""" query_lower = user_input.lower()

if self.language == "fr":
    default_questions = [
        "Pouvez-vous me parler de vos principales découvertes au Périgord?",
        # Autres questions...
    ]

```

4. Amélioration de la cohérence linguistique

Le système a été modifié pour présenter clairement les extraits en anglais tout en maintenant une structure en français:

```python

Note explicative sur la langue

response_parts.append("## Note sur la langue") response_parts.append("Bien que mes publications scientifiques fussent rédigées en anglais, je vous présente ici une synthèse en français de mes travaux.") ```

5. Intégration de l'ontologie et de la méréologie

Des fonctions ont été ajoutées pour exploiter les structures ontologiques et méréologiques:

python def initialize_knowledge_base(self): """Charge et structure l'ontologie et la méréologie""" self.structured_ontology = {} self.structured_mereology = {} # Traitement des données...

Résultats

Les modifications ont permis d'obtenir:

Des réponses plus cohérentes et sans répétitions
Une meilleure présentation des extraits originaux
Une gestion appropriée des questions sensibles
Une exploitation plus riche des connaissances structurées

Conclusion

Ce processus d'optimisation illustre les défis spécifiques de la création d'avatars historiques utilisant le RAG. Il souligne l'importance d'une adaptation fine des mécanismes de génération et de vérification pour produire des interactions authentiques et informatives.

L'amélioration de ce système démontre comment les techniques d'IA contemporaines peuvent être adaptées pour préserver et transmettre le patrimoine scientifique historique de manière interactive et engageante.

ArcheologieApprentissage automatiqueNLPDocumentation

Retour en haut

Newsletter Portfolio

Récits visuels, horizons numériques :

Chaque newsletter, un voyage entre données, créativité et découvertes

OPENEDITION : carnet HYPOTHESES - Blog scientifique Archnum

Prototype CRM Relations Entreprises

L'Art des Mots et des Données

Comment lire Reliquiae Aquitanicae ? Avatar Edouard Lartet : Agent Conversationnel Historique

Mini-buzz avec Cluely

Optimisation d'un avatar conversationnel pour l'archéologie préhistorique

OPENEDITION : carnet HYPOTHESES - Blog scientifique Archnum

OpenEdition, le portail de la communication scientifique en SHS

Démocratiser l'accès aux savoirs et aux connaissances est très clairement l'un de leurs enjeux.

Présentation de la plateforme de publication Hypothèses

Prototype CRM Relations Entreprises

Présentation

Fonctionnalités Principales

Technologies Utilisées

Capture d'Écran

Lien du Projet

L'Art des Mots et des Données

Transformation des Données en Récits

Image Représentative

Concept Fondamental

Dimensions de la Transformation

1. Décryptage

2. Contextualisation

3. Narration

Processus Méthodologique

Analyse Rigoureuse

Contextualisation Narrative

Visualisation Éloquente

Communication Stratégique

Compétences Clés

Techniques

Créatives

Philosophie

Applications

Impact

Comment lire Reliquiae Aquitanicae ? Avatar Edouard Lartet : Agent Conversationnel Historique

Présentation du Projet "Avatar Lartet"

Quelle est cette publication Reliquiae Aquitanicae ?

Objectifs

Cadre de l'analyse

Technologies Utilisées

Lien du Projet

Fonctionnalités Principales

Compétences mises en oeuvre

Référence

Mini-buzz avec Cluely

Cluely : de ton entretien d'embauche à ton rancard !

« La société a pour but de ramener aux habitudes d’une vie honnête et laborieuse...lui paraissent susceptibles de revenir au bien » ref

Optimisation d'un avatar conversationnel pour l'archéologie préhistorique

Introduction

Défis identifiés

Solutions développées

1. Amélioration de l'extraction d'informations

Éviter les doublons entre catégories

2. Gestion des questions sensibles

3. Restructuration du générateur de questions suggérées

4. Amélioration de la cohérence linguistique

Note explicative sur la langue

5. Intégration de l'ontologie et de la méréologie

Résultats

Conclusion

Restons connectés !