CatNip por Seb
Extrait des tableaux via XPath, les traites par des filtres et génère des fichiers .csv propres dans CatNip-Folder.
ExperimentalExperimental
Metadados da extensão
Acerca desta extensão
CatNip est une extension Firefox permettant de sélectionner des éléments d’une page HTML, principalement des tableaux, et d’en extraire le contenu à l’aide de sélecteurs XPath, afin de générer automatiquement des fichiers .txt propres, lisibles et facilement transformables en CSV.
L’extension intègre de nombreuses fonctionnalités de traitement, renommage et filtrage permettant de transformer des données brutes issues de pages web en informations cohérentes et exploitables.
Les fichiers générés sont enregistrés localement dans un dossier dédié (CatNip-Folder, situé par défaut dans le dossier Téléchargements), facilitant leur réutilisation pour l’analyse, le traitement ou l’archivage.
L’utilisation de l’extension XPath Finder est fortement recommandée afin d’obtenir facilement les expressions XPath des éléments à extraire.
CatNip ne collecte aucune donnée personnelle et n’effectue aucune communication réseau externe.
Guide d'utilisation
Accès à CatNip
Une fois sur une page contenant des tableaux HTML à extraire, appuyez sur Ctrl + Shift + § afin d’afficher l’interface principale de CatNip.
Extraction simple (menu principal)
Le bloc CatNip — Extraction de tables (XPath → .csv) permet d’extraire rapidement un tableau en collant directement un XPath (un XPath par ligne).
Chaque XPath fourni génère un tableau distinct dans le fichier de sortie.
Fonctionnalité FastXpath
En cliquant sur l’un des boutons numérotés situés en haut à droite de l’interface principale, vous accédez aux presets FastXpath.
Toutes les informations saisies dans un FastXpath sont sauvegardées automatiquement dès leur modification.
Bloc XPath
Le fonctionnement est similaire à l’extraction simple, mais FastXpath ajoute une syntaxe avancée permettant de gagner du temps.
Si le tableau HTML à extraire est précédé d’un titre (par exemple « Herbe à chat »), il est possible d’utiliser la syntaxe suivante :
Dans cet exemple :
$S"Herbe à chat" indique le texte à rechercher
$N1 indique que l’on souhaite utiliser la première occurrence trouvée
CatNip localise automatiquement le tableau associé au titre correspondant
Il est possible d’utiliser plusieurs instructions de ce type, une par ligne.
Bloc Nom (optionnel)
Ce bloc permet d’attribuer un nom personnalisé aux tableaux extraits, à la place du nom généré automatiquement à partir du XPath.
Le fonctionnement est identique au bloc XPath : un nom par ligne, dans le même ordre.
Bloc Lien (optionnel)
Ce champ permet à CatNip d’identifier automatiquement si le site actuellement consulté correspond à un FastXpath enregistré.
La syntaxe $C (Cut) permet d’ignorer certaines parties de l’URL afin de ne comparer que les segments pertinents.
Exemple :
Cette règle correspondra à toutes les URL contenant :
www.
puis /herbeachat/
Lorsque CatNip détecte une correspondance, un icône FastXpath apparaît à l’écran, permettant de lancer immédiatement l’extraction associée, sans ouvrir l’interface principale.
Renommage (optionnel) et Filtre (optionnel)
Ces champs acceptent des identifiants de filtres sous forme de nombres à deux chiffres, séparés par des virgules (ex : 11,24,50).
Les Renommages sont appliqués en premier
Les Filtres sont ensuite appliqués
L’ordre des identifiants est respecté de gauche à droite
Paramètres
Le menu Paramètres permet de :
Configurer les raccourcis clavier
Exporter la configuration complète
Importer une configuration existante
Réinitialiser entièrement CatNip
La configuration inclut :
Tous les FastXpath
Les règles de renommage
Les filtres
Les raccourcis et préférences
Renommage
La section Renommage permet de remplacer des valeurs dans le fichier généré.
Colonne Chercher : texte à identifier
Colonne Remplacer : valeur de substitution
Exemple :
Filtres
La section Filtre permet de transformer la structure des tableaux extraits.
La première page est réservée aux filtres hardcodés (non modifiables).
Parmi les filtres disponibles :
Suppression d’une colonne via le nom de son en-tête
Suppression d’une ligne via une valeur cible
Décuplement de plusieurs éléments en plusieurs lignes
(ex : élément1 élément2 élément3;A;B)
via la syntaxe $CoX pour cibler une colonne
Décuplement d’un intervalle unique
(ex : élément001-003;A;B)
également via $CoX
Avertissement
CatNip est une extension expérimentale.
Certaines fonctionnalités avancées reposent sur la structure des pages HTML et peuvent être sensibles à des changements de mise en page. L’extension n’est pas encore entièrement stable et doit être utilisée avec discernement.
L’extension intègre de nombreuses fonctionnalités de traitement, renommage et filtrage permettant de transformer des données brutes issues de pages web en informations cohérentes et exploitables.
Les fichiers générés sont enregistrés localement dans un dossier dédié (CatNip-Folder, situé par défaut dans le dossier Téléchargements), facilitant leur réutilisation pour l’analyse, le traitement ou l’archivage.
L’utilisation de l’extension XPath Finder est fortement recommandée afin d’obtenir facilement les expressions XPath des éléments à extraire.
CatNip ne collecte aucune donnée personnelle et n’effectue aucune communication réseau externe.
Guide d'utilisation
Accès à CatNip
Une fois sur une page contenant des tableaux HTML à extraire, appuyez sur Ctrl + Shift + § afin d’afficher l’interface principale de CatNip.
Extraction simple (menu principal)
Le bloc CatNip — Extraction de tables (XPath → .csv) permet d’extraire rapidement un tableau en collant directement un XPath (un XPath par ligne).
Chaque XPath fourni génère un tableau distinct dans le fichier de sortie.
Fonctionnalité FastXpath
En cliquant sur l’un des boutons numérotés situés en haut à droite de l’interface principale, vous accédez aux presets FastXpath.
Toutes les informations saisies dans un FastXpath sont sauvegardées automatiquement dès leur modification.
Bloc XPath
Le fonctionnement est similaire à l’extraction simple, mais FastXpath ajoute une syntaxe avancée permettant de gagner du temps.
Si le tableau HTML à extraire est précédé d’un titre (par exemple « Herbe à chat »), il est possible d’utiliser la syntaxe suivante :
$N1$S"Herbe à chat"
Dans cet exemple :
$S"Herbe à chat" indique le texte à rechercher
$N1 indique que l’on souhaite utiliser la première occurrence trouvée
CatNip localise automatiquement le tableau associé au titre correspondant
Il est possible d’utiliser plusieurs instructions de ce type, une par ligne.
Bloc Nom (optionnel)
Ce bloc permet d’attribuer un nom personnalisé aux tableaux extraits, à la place du nom généré automatiquement à partir du XPath.
Le fonctionnement est identique au bloc XPath : un nom par ligne, dans le même ordre.
Bloc Lien (optionnel)
Ce champ permet à CatNip d’identifier automatiquement si le site actuellement consulté correspond à un FastXpath enregistré.
La syntaxe $C (Cut) permet d’ignorer certaines parties de l’URL afin de ne comparer que les segments pertinents.
Exemple :
www.$C/herbeachat/
Cette règle correspondra à toutes les URL contenant :
www.
puis /herbeachat/
Lorsque CatNip détecte une correspondance, un icône FastXpath apparaît à l’écran, permettant de lancer immédiatement l’extraction associée, sans ouvrir l’interface principale.
Renommage (optionnel) et Filtre (optionnel)
Ces champs acceptent des identifiants de filtres sous forme de nombres à deux chiffres, séparés par des virgules (ex : 11,24,50).
Les Renommages sont appliqués en premier
Les Filtres sont ensuite appliqués
L’ordre des identifiants est respecté de gauche à droite
Paramètres
Le menu Paramètres permet de :
Configurer les raccourcis clavier
Exporter la configuration complète
Importer une configuration existante
Réinitialiser entièrement CatNip
La configuration inclut :
Tous les FastXpath
Les règles de renommage
Les filtres
Les raccourcis et préférences
Renommage
La section Renommage permet de remplacer des valeurs dans le fichier généré.
Colonne Chercher : texte à identifier
Colonne Remplacer : valeur de substitution
Exemple :
icons/clipboard-check.svg → OLD
Filtres
La section Filtre permet de transformer la structure des tableaux extraits.
La première page est réservée aux filtres hardcodés (non modifiables).
Parmi les filtres disponibles :
Suppression d’une colonne via le nom de son en-tête
Suppression d’une ligne via une valeur cible
Décuplement de plusieurs éléments en plusieurs lignes
(ex : élément1 élément2 élément3;A;B)
via la syntaxe $CoX pour cibler une colonne
Décuplement d’un intervalle unique
(ex : élément001-003;A;B)
également via $CoX
Avertissement
CatNip est une extension expérimentale.
Certaines fonctionnalités avancées reposent sur la structure des pages HTML et peuvent être sensibles à des changements de mise en page. L’extension n’est pas encore entièrement stable et doit être utilisée avec discernement.
Rated 0 by 0 reviewers
Permissions and data
Permissões necessárias:
- Transferir ficheiros, ler e modificar o histórico de transferências do navegador
- Aceder aos seus dados para todos os sites
Mais informação
- Versão
- 1.4.0
- Tamanho
- 98,13 KB
- Última atualização
- há 8 dias (26 de dez de 2025)
- Categorias relacionadas
- Licença
- MIT License
- Histórico de versões
- Adicionar à coleção