Comment transférer du contenu de la Wayback Machine (archive.org) vers Wordpress?

Publié par: 2019-12-04

En utilisant l'option «Extraire du contenu structuré», vous pouvez facilement créer un blog Wordpress à partir du site présent sur les archives Web et de tout autre site. Pour ce faire, commencez par rechercher le site source, puis cochez la case "Extraire du contenu structuré" dans l'outil "Restaurer le site" ou "Télécharger le site". Entrez vos options (email, timestamps, etc.) et commencez le téléchargement.


Lorsqu'un processus de téléchargement de site Web est terminé, le système le déploie sur notre serveur et commence à extraire le contenu. Lors de la création d'une archive d'articles, notre analyseur ne prend en compte que le contenu pertinent, à l'exclusion des articles, contrôles et pages de service en double, ne laissant que les articles avec formatage enregistré prêts à être importés sur votre site Web. Une fois le processus d'extraction des articles terminé, vous recevrez une lettre de confirmation, l'ouvrirez et téléchargerez le contenu - le bouton "Articles (.zip)".


L'archive zip contient le contenu extrait dans divers formats, à partir duquel un fichier portant l'extension .wxr est sélectionné. Sur votre site Web Wordpress, démarrez l'importation de contenu - (dans le panneau d'administration de Wordpress - Outils - Importer - Wordpress - Démarrer l'importation).


Si le contenu extrait contient des images, des liens vers celles-ci seront contenus dans le fichier article. Pour les importer dans votre site Wordpress, vous devez utiliser notre plug-in Archivarix External Images Importer. Dans l'onglet "Paramètres de téléchargement" du plug-in, vous pouvez définir le paramètre "Démarrer le téléchargement" sur "Immédiatement". Cela signifie que lors de l’importation d’un fichier avec des articles, le plugin téléchargera immédiatement toutes les images externes dans la galerie multimédia de Wordpress. Si vous avez beaucoup d'images, vous pouvez utiliser l'importation en arrière-plan. Dans le même onglet, choisissez "Mettre en file d'attente", puis cliquez sur le bouton "Exécuter le traitement en arrière-plan". Après un certain temps, tous les fichiers multimédia disponibles seront importés sur votre site.

L'utilisation de matériel d'article n'est autorisée que si le lien vers la source est publié: https://fr.archivarix.com/blog/convert-archiveorg-to-wordpress/

Dernières actualités:
2020.01.23
Une autre méga-mise à jour d'Archivarix CMS!

Ajout d'outils très utiles qui permettent de cliquer sur un bouton:
- nettoyer tous les liens internes rompus,
- supprimer les images manquantes,
- définissez rel = "nofollow" pour tous les liens externes.

Désormais, une récupération supplémentaire peut être importée directement à partir du CMS lui-même. Vous pouvez combiner différentes récupérations en un seul site de travail.

Pour ceux qui travaillent avec de grands sites ou utilisent un hébergement médiocre - toutes les actions qui pouvaient auparavant s'arrêter au moment de votre hébergement seront désormais divisées en parties et continueront automatiquement jusqu'à ce qu'elles soient terminées. Vous voulez faire un remplacement dans le code de 500 mille fichiers? Importer une récupération de plusieurs gigaoctets? Tout cela est désormais possible sur n'importe quel hébergement, même très bon marché. Le délai d'expiration (par défaut, 30 secondes) peut être modifié dans le paramètre ACMS_TIMEOUT.

Notre chargeur (index.php) fonctionne désormais sur les protocoles http et https, quels que soient les paramètres de construction. Vous pouvez forcer le protocole en modifiant la valeur du paramètre ARCHIVARIX_PROTOCOL.
2020.01.07
La prochaine mise à jour du CMS Archivarix avec l'ajout de nouvelles fonctionnalités. Maintenant, n'importe quel ancien site peut être correctement converti en UTF-8 en cliquant sur un bouton. Le filtrage des recherches est devenu encore meilleur, car Maintenant, les résultats peuvent être filtrés par type MIME.
2019.12.20
Nous avons publié la mise à jour tant attendue d'Archivarix CMS. Dans la nouvelle version, en plus de diverses améliorations et optimisations, il existe une fonctionnalité très utile pour un filtrage supplémentaire des résultats de recherche et une prise en charge complète de l'arborescence des URL pour les récupérations avec un grand nombre de fichiers. Plus de détails peuvent être trouvés dans le journal des modifications apportées au script CMS Archivarix .
2019.11.27
Notre plugin Archivarix External Images Importer a été publié. Le plugin importe des images de sites Web tiers, dont les liens sont situés dans des publications et des pages, dans la galerie WordPress. Si l'image est actuellement indisponible ou supprimée, le plugin en télécharge une copie à partir des archives Web.
2019.11.20
Nous avons ajouté une nouvelle section de notre site - Blog Archivarix . Vous pouvez y lire des informations utiles sur le fonctionnement de notre système et sur la restauration de sites à partir d'Archive.org.