CatNip av Seb
Extrait des tableaux via XPath, les traites par des filtres et génÚre des fichiers .csv propres dans CatNip-Folder.
EksperimentellEksperimentell
Metadata for utvidelser
Om denne utvidelsen
CatNip est une extension Firefox permettant de sĂ©lectionner des Ă©lĂ©ments dâune page HTML, principalement des tableaux, et dâen extraire le contenu Ă lâaide de sĂ©lecteurs XPath, afin de gĂ©nĂ©rer automatiquement des fichiers .txt propres, lisibles et facilement transformables en CSV.
Lâextension intĂšgre de nombreuses fonctionnalitĂ©s de traitement, renommage et filtrage permettant de transformer des donnĂ©es brutes issues de pages web en informations cohĂ©rentes et exploitables.
Les fichiers gĂ©nĂ©rĂ©s sont enregistrĂ©s localement dans un dossier dĂ©diĂ© (CatNip-Folder, situĂ© par dĂ©faut dans le dossier TĂ©lĂ©chargements), facilitant leur rĂ©utilisation pour lâanalyse, le traitement ou lâarchivage.
Lâutilisation de lâextension XPath Finder est fortement recommandĂ©e afin dâobtenir facilement les expressions XPath des Ă©lĂ©ments Ă extraire.
CatNip ne collecte aucune donnĂ©e personnelle et nâeffectue aucune communication rĂ©seau externe.
Guide d'utilisation
AccĂšs Ă CatNip
Une fois sur une page contenant des tableaux HTML Ă extraire, appuyez sur Ctrl + Shift + § afin dâafficher lâinterface principale de CatNip.
Extraction simple (menu principal)
Le bloc CatNip â Extraction de tables (XPath â .csv) permet dâextraire rapidement un tableau en collant directement un XPath (un XPath par ligne).
Chaque XPath fourni génÚre un tableau distinct dans le fichier de sortie.
Fonctionnalité FastXpath
En cliquant sur lâun des boutons numĂ©rotĂ©s situĂ©s en haut Ă droite de lâinterface principale, vous accĂ©dez aux presets FastXpath.
Toutes les informations saisies dans un FastXpath sont sauvegardées automatiquement dÚs leur modification.
Bloc XPath
Le fonctionnement est similaire Ă lâextraction simple, mais FastXpath ajoute une syntaxe avancĂ©e permettant de gagner du temps.
Si le tableau HTML Ă extraire est prĂ©cĂ©dĂ© dâun titre (par exemple « Herbe Ă chat »), il est possible dâutiliser la syntaxe suivante :
Dans cet exemple :
$S"Herbe Ă chat" indique le texte Ă rechercher
$N1 indique que lâon souhaite utiliser la premiĂšre occurrence trouvĂ©e
CatNip localise automatiquement le tableau associé au titre correspondant
Il est possible dâutiliser plusieurs instructions de ce type, une par ligne.
Bloc Nom (optionnel)
Ce bloc permet dâattribuer un nom personnalisĂ© aux tableaux extraits, Ă la place du nom gĂ©nĂ©rĂ© automatiquement Ă partir du XPath.
Le fonctionnement est identique au bloc XPath : un nom par ligne, dans le mĂȘme ordre.
Bloc Lien (optionnel)
Ce champ permet Ă CatNip dâidentifier automatiquement si le site actuellement consultĂ© correspond Ă un FastXpath enregistrĂ©.
La syntaxe $C (Cut) permet dâignorer certaines parties de lâURL afin de ne comparer que les segments pertinents.
Exemple :
Cette rĂšgle correspondra Ă toutes les URL contenant :
www.
puis /herbeachat/
Lorsque CatNip dĂ©tecte une correspondance, un icĂŽne FastXpath apparaĂźt Ă lâĂ©cran, permettant de lancer immĂ©diatement lâextraction associĂ©e, sans ouvrir lâinterface principale.
Renommage (optionnel) et Filtre (optionnel)
Ces champs acceptent des identifiants de filtres sous forme de nombres à deux chiffres, séparés par des virgules (ex : 11,24,50).
Les Renommages sont appliqués en premier
Les Filtres sont ensuite appliqués
Lâordre des identifiants est respectĂ© de gauche Ă droite
ParamĂštres
Le menu ParamĂštres permet de :
Configurer les raccourcis clavier
Exporter la configuration complĂšte
Importer une configuration existante
Réinitialiser entiÚrement CatNip
La configuration inclut :
Tous les FastXpath
Les rĂšgles de renommage
Les filtres
Les raccourcis et préférences
Renommage
La section Renommage permet de remplacer des valeurs dans le fichier généré.
Colonne Chercher : texte Ă identifier
Colonne Remplacer : valeur de substitution
Exemple :
Filtres
La section Filtre permet de transformer la structure des tableaux extraits.
La premiÚre page est réservée aux filtres hardcodés (non modifiables).
Parmi les filtres disponibles :
Suppression dâune colonne via le nom de son en-tĂȘte
Suppression dâune ligne via une valeur cible
Décuplement de plusieurs éléments en plusieurs lignes
(ex : élément1 élément2 élément3;A;B)
via la syntaxe $CoX pour cibler une colonne
DĂ©cuplement dâun intervalle unique
(ex : élément001-003;A;B)
également via $CoX
Avertissement
CatNip est une extension expérimentale.
Certaines fonctionnalitĂ©s avancĂ©es reposent sur la structure des pages HTML et peuvent ĂȘtre sensibles Ă des changements de mise en page. Lâextension nâest pas encore entiĂšrement stable et doit ĂȘtre utilisĂ©e avec discernement.
Lâextension intĂšgre de nombreuses fonctionnalitĂ©s de traitement, renommage et filtrage permettant de transformer des donnĂ©es brutes issues de pages web en informations cohĂ©rentes et exploitables.
Les fichiers gĂ©nĂ©rĂ©s sont enregistrĂ©s localement dans un dossier dĂ©diĂ© (CatNip-Folder, situĂ© par dĂ©faut dans le dossier TĂ©lĂ©chargements), facilitant leur rĂ©utilisation pour lâanalyse, le traitement ou lâarchivage.
Lâutilisation de lâextension XPath Finder est fortement recommandĂ©e afin dâobtenir facilement les expressions XPath des Ă©lĂ©ments Ă extraire.
CatNip ne collecte aucune donnĂ©e personnelle et nâeffectue aucune communication rĂ©seau externe.
Guide d'utilisation
AccĂšs Ă CatNip
Une fois sur une page contenant des tableaux HTML Ă extraire, appuyez sur Ctrl + Shift + § afin dâafficher lâinterface principale de CatNip.
Extraction simple (menu principal)
Le bloc CatNip â Extraction de tables (XPath â .csv) permet dâextraire rapidement un tableau en collant directement un XPath (un XPath par ligne).
Chaque XPath fourni génÚre un tableau distinct dans le fichier de sortie.
Fonctionnalité FastXpath
En cliquant sur lâun des boutons numĂ©rotĂ©s situĂ©s en haut Ă droite de lâinterface principale, vous accĂ©dez aux presets FastXpath.
Toutes les informations saisies dans un FastXpath sont sauvegardées automatiquement dÚs leur modification.
Bloc XPath
Le fonctionnement est similaire Ă lâextraction simple, mais FastXpath ajoute une syntaxe avancĂ©e permettant de gagner du temps.
Si le tableau HTML Ă extraire est prĂ©cĂ©dĂ© dâun titre (par exemple « Herbe Ă chat »), il est possible dâutiliser la syntaxe suivante :
$N1$S"Herbe Ă chat"
Dans cet exemple :
$S"Herbe Ă chat" indique le texte Ă rechercher
$N1 indique que lâon souhaite utiliser la premiĂšre occurrence trouvĂ©e
CatNip localise automatiquement le tableau associé au titre correspondant
Il est possible dâutiliser plusieurs instructions de ce type, une par ligne.
Bloc Nom (optionnel)
Ce bloc permet dâattribuer un nom personnalisĂ© aux tableaux extraits, Ă la place du nom gĂ©nĂ©rĂ© automatiquement Ă partir du XPath.
Le fonctionnement est identique au bloc XPath : un nom par ligne, dans le mĂȘme ordre.
Bloc Lien (optionnel)
Ce champ permet Ă CatNip dâidentifier automatiquement si le site actuellement consultĂ© correspond Ă un FastXpath enregistrĂ©.
La syntaxe $C (Cut) permet dâignorer certaines parties de lâURL afin de ne comparer que les segments pertinents.
Exemple :
www.$C/herbeachat/
Cette rĂšgle correspondra Ă toutes les URL contenant :
www.
puis /herbeachat/
Lorsque CatNip dĂ©tecte une correspondance, un icĂŽne FastXpath apparaĂźt Ă lâĂ©cran, permettant de lancer immĂ©diatement lâextraction associĂ©e, sans ouvrir lâinterface principale.
Renommage (optionnel) et Filtre (optionnel)
Ces champs acceptent des identifiants de filtres sous forme de nombres à deux chiffres, séparés par des virgules (ex : 11,24,50).
Les Renommages sont appliqués en premier
Les Filtres sont ensuite appliqués
Lâordre des identifiants est respectĂ© de gauche Ă droite
ParamĂštres
Le menu ParamĂštres permet de :
Configurer les raccourcis clavier
Exporter la configuration complĂšte
Importer une configuration existante
Réinitialiser entiÚrement CatNip
La configuration inclut :
Tous les FastXpath
Les rĂšgles de renommage
Les filtres
Les raccourcis et préférences
Renommage
La section Renommage permet de remplacer des valeurs dans le fichier généré.
Colonne Chercher : texte Ă identifier
Colonne Remplacer : valeur de substitution
Exemple :
icons/clipboard-check.svg â OLD
Filtres
La section Filtre permet de transformer la structure des tableaux extraits.
La premiÚre page est réservée aux filtres hardcodés (non modifiables).
Parmi les filtres disponibles :
Suppression dâune colonne via le nom de son en-tĂȘte
Suppression dâune ligne via une valeur cible
Décuplement de plusieurs éléments en plusieurs lignes
(ex : élément1 élément2 élément3;A;B)
via la syntaxe $CoX pour cibler une colonne
DĂ©cuplement dâun intervalle unique
(ex : élément001-003;A;B)
également via $CoX
Avertissement
CatNip est une extension expérimentale.
Certaines fonctionnalitĂ©s avancĂ©es reposent sur la structure des pages HTML et peuvent ĂȘtre sensibles Ă des changements de mise en page. Lâextension nâest pas encore entiĂšrement stable et doit ĂȘtre utilisĂ©e avec discernement.
Vurdert til 0 av 0 anmeldere
Tillatelser og data
NĂždvendige tillatelser:
- Last ned filer, samt lese og modifisere nettleserens nedlastingshistorikk
- FĂ„ tilgang til dine data fra alle nettsteder
Mer informasjon
- Versjon
- 1.4.0
- StĂžrrelse
- 98,13 kB
- Sist oppdatert
- 8 dager siden (26. des. 2025)
- Relaterte kategorier
- Lisens
- MIT License
- Versjonshistorikk
- Legg til i samling