Expressions régulières utilisées dans Archivarix CMS

Publié par: 2020-02-06

Cet article décrit les expressions régulières utilisées pour rechercher et remplacer du contenu dans des sites Web restaurés à l'aide du système Archivarix. Ils ne sont pas uniques à ce système. Si vous connaissez les expressions régulières de PHP, Perl, Java ou d'autres langages de programmation, alors vous savez déjà comment utiliser notre recherche et remplacer.

Les expressions régulières sont un langage formel pour rechercher et manipuler des sous-chaînes de texte, basé sur l'utilisation de métacaractères. Pour la recherche, un modèle est utilisé, composé de caractères et de métacaractères et définissant une règle de recherche. Pour la manipulation de texte, une chaîne de remplacement supplémentaire est également spécifiée, qui peut également contenir des caractères spéciaux.

Voici le constructeur d'expressions régulières en ligne, qui vous permet de créer et de tester des expressions régulières à l'aide d'une interface simple - https://regexr.com/

La liste des expressions régulières utilisées:

[abc] Un seul caractère: a, b ou c
[^ abc] N'importe quel caractère, sauf a, b ou c
[az] N'importe quel caractère unique dans la plage az
[a-zA-Z] N'importe quel caractère unique dans la plage az ou AZ
^ Début de ligne
$ Fin de ligne
\ Un début de chaîne
\ z Fin de chaîne
. N'importe quel caractère
\ s Tout caractère d'espacement
\ S Tout caractère non blanc
\ d N'importe quel chiffre
\ D Tout non numérique
\ w N'importe quel caractère de mot (lettre, chiffre, trait de soulignement)
\ W N'importe quel caractère autre qu'un mot
\ b Tout caractère de limite de mot
(...) Capturez tout ce qui est enfermé
(a | b) a ou b
a? Zéro ou l'un d'un
a * Zéro ou plus d'un
a + Un ou plusieurs d'un
a {3} Exactement 3 d'un
a {3,} 3 ou plus d'un
a {3,6} Entre 3 et 6 d'un

L'utilisation de matériel d'article n'est autorisée que si le lien vers la source est publié: https://fr.archivarix.com/blog/regex/

Dernières actualités:
2020.02.14
Nouveau vendredi, nouvelles mises à jour!
Beaucoup de nouveautés et d'utilités ont été réalisées dans Archivarix CMS:
- Dans Rechercher et remplacer, vous pouvez désormais filtrer par date d'URL.
- Désormais, les liens externes de toutes les pages du site peuvent être supprimés en cliquant sur un bouton. Les ancres sont conservées.
- Un nouveau paramètre ACMS_SAFE_MODE, qui interdit de modifier les paramètres Loader / CMS et de charger des fichiers personnalisés, il est également interdit pour les importations d'importer des paramètres et des fichiers personnalisés.
- Paramètres du chargeur et du CMS Les fichiers JSON peuvent maintenant être téléchargés sur votre ordinateur et téléchargés sur le CMS à partir d'un fichier sur votre ordinateur. Ainsi, le transfert des paramètres vers d'autres sites est devenu encore plus facile.
- La création de règles personnalisées est devenue plus pratique, il existe souvent des modèles que vous pouvez choisir.
- De nouveaux fichiers personnalisés peuvent être créés dans le gestionnaire de fichiers sans avoir à télécharger le fichier.
- L'arborescence d'URL pour le domaine principal vient toujours en premier.
- Si vous masquez l'arborescence des URL du domaine / sous-domaine, ce paramètre est enregistré lorsque vous travaillez avec le CMS.
- Au lieu de deux boutons, ouvrez / réduisez l'arborescence des URL, maintenant celui qui peut faire les deux.
- La création d'une nouvelle URL a été simplifiée et lors de la création, vous pouvez immédiatement spécifier le fichier depuis l'ordinateur.
- Dans la disposition mobile, la partie principale de travail vient en premier.
- Après chaque manipulation du fichier, sa taille est mise à jour dans la base de données.
- Boutons fixes pour les annulations sélectives de l'historique.
- Correction de la création de nouvelles URL pour les sous-domaines contenant des numéros dans le nom de domaine.
2020.02.07
Nouvelle portion de mises à jour!
Il n'est pas nécessaire de modifier quoi que ce soit dans le code source des fichiers maintenant.
- Vous pouvez désormais télécharger des sites sur le serveur en téléchargeant sur le serveur un seul script à partir de notre CMS Archivarix.
- Pour changer quelque chose dans les paramètres du CMS, vous n'avez plus besoin d'ouvrir son code source. Vous pouvez définir un mot de passe ou des limites inférieures directement à partir de la section Paramètres.
- Pour connecter vos compteurs, trackers, scripts personnalisés, un dossier séparé "comprend" est désormais utilisé dans le dossier .content.xxxxxx. Vous pouvez également télécharger des fichiers personnalisés directement via le nouveau gestionnaire de fichiers dans CMS. L'ajout de compteurs et d'analyses à toutes les pages du site est également devenu pratique et compréhensible.
- Les importations prennent en charge une nouvelle structure de fichiers avec des paramètres et le dossier "comprend".
- Ajout de raccourcis clavier pour travailler dans l'éditeur de code.

Ces améliorations et bien d'autres dans la nouvelle version. Le chargeur a également été mis à jour et fonctionne avec les paramètres créés par le CMS.
2020.01.23
Une autre méga-mise à jour d'Archivarix CMS!

Ajout d'outils très utiles qui permettent de cliquer sur un bouton:
- nettoyer tous les liens internes rompus,
- supprimer les images manquantes,
- définissez rel = "nofollow" pour tous les liens externes.

Désormais, une récupération supplémentaire peut être importée directement à partir du CMS lui-même. Vous pouvez combiner différentes récupérations en un seul site de travail.

Pour ceux qui travaillent avec de grands sites ou utilisent un hébergement médiocre - toutes les actions qui pouvaient auparavant s'arrêter au moment de votre hébergement seront désormais divisées en parties et continueront automatiquement jusqu'à ce qu'elles soient terminées. Vous voulez faire un remplacement dans le code de 500 mille fichiers? Importer une récupération de plusieurs gigaoctets? Tout cela est désormais possible sur n'importe quel hébergement, même très bon marché. Le délai d'expiration (par défaut, 30 secondes) peut être modifié dans le paramètre ACMS_TIMEOUT.

Notre chargeur (index.php) fonctionne désormais sur les protocoles http et https, quels que soient les paramètres de construction. Vous pouvez forcer le protocole en modifiant la valeur du paramètre ARCHIVARIX_PROTOCOL.
2020.01.07
La prochaine mise à jour du CMS Archivarix avec l'ajout de nouvelles fonctionnalités. Maintenant, n'importe quel ancien site peut être correctement converti en UTF-8 en cliquant sur un bouton. Le filtrage des recherches est devenu encore meilleur, car Maintenant, les résultats peuvent être filtrés par type MIME.
2019.12.20
Nous avons publié la mise à jour tant attendue d'Archivarix CMS. Dans la nouvelle version, en plus de diverses améliorations et optimisations, il existe une fonctionnalité très utile pour un filtrage supplémentaire des résultats de recherche et une prise en charge complète de l'arborescence des URL pour les récupérations avec un grand nombre de fichiers. Plus de détails peuvent être trouvés dans le journal des modifications apportées au script CMS Archivarix .