Nettoyez le code HTML des déchets. Convertisseur en ligne de fichiers Excel, Word et txt en code HTML pur sans styles CSS inutiles. texte source du plugin

Débarrassez-vous de votre balisage sale avec HTML Cleaner en ligne gratuit. Il est très simple de composer, éditer, formater et réduire le code Web avec cet outil en ligne. Convertissez des documents Word en HTML ordonné et tout autre document visuel comme Excel, PDF, Google Docs, etc. Il est extrêmement simple et efficace de travailler avec les deux éditeurs visuels et sources ci-joints qui répondent instantanément à vos actions.

HTML Cleaner est équipé de nombreuses fonctionnalités utiles pour rendre le nettoyage et l'édition HTML aussi simples que possible. Collez simplement votre code dans la zone de texte, configurez les préférences de nettoyage et appuyez sur le bouton HTML propre bouton. Il peut gérer n'importe quel document créé avec Microsoft Excel, PowerPoint, Google Docs ou tout autre compositeur. Il vous aide à vous débarrasser facilement de tous les styles en ligne et des codes inutiles ajoutés par Microsoft Word ou d'autres éditeurs WYSIWYG. Cet outil d'édition HTML est utile lorsque vous migrez le contenu d'un site Web à un autre et que vous souhaitez nettoyer toutes les classes et identifiants étrangers appliqués par le site source. Utilisez l'outil de recherche et de remplacement pour vos commandes personnalisées. Le générateur de texte charabia vous permet d'ajouter facilement du texte factice à l'éditeur.

En haut de la page, vous pouvez voir l'éditeur visuel et l'éditeur de code source côte à côte. Quelle que soit la modification que vous modifiez, les modifications seront répercutées sur l'autre en temps réel. L'éditeur HTML visuel permet aux débutants de composer facilement leur contenu comme s'ils utilisaient n'importe quel autre programme de traitement de texte, tandis qu'à droite, l'éditeur source avec le balisage de code en surbrillance aide les utilisateurs avancés à ajuster le code. Cela fait de ce programme en ligne un outil intéressant pour apprendre le codage HTML.

Convertir des documents Word en HTML propre

Pour publier des PDF en ligne, Microsoft Word, Excel, PowerPoint ou tout autre document composé avec différents programmes d'édition de mots ou simplement pour copier le contenu copié à partir d'un autre site Web, collez le contenu formaté dans l'éditeur visuel. La source HTML du document sera également immédiatement visible dans l'éditeur de source. La barre de contrôle au-dessus de l'éditeur WYSIWYG contrôle ce champ tandis que tous les autres paramètres de nettoyage de source servent à modifier le code source. Clique le HTML propre après avoir configuré les préférences de nettoyage. Copiez le code nettoyé et publiez-le sur votre site Web.

Il n'y a aucune garantie que le programme corrige toutes les erreurs de votre code exactement comme vous le souhaitez, alors essayez de saisir un code HTML syntaxiquement valide.

Convertissez les tableaux HTML en éléments div structurés en activant la case correspondante.

Nettoyer le code HTML des balises Microsoft Word (2000-2007) ?

Dans le passé, les concepteurs de sites Web construisaient leurs sites Web à l'aide de tableaux pour organiser la mise en page, mais à l'ère de la conception Web réactive, les tableaux sont obsolètes et les DIV prennent leur place. Cet outil en ligne vous aide à transformer vos tableaux en éléments div structurés en quelques clics simples.

Vous pouvez rendre votre code source plus lisible en organisant la hiérarchie des onglets dans une arborescence.

Devenir membre

Ce site Web est un outil entièrement fonctionnel pour nettoyer et composer du code HTML, mais vous avez la possibilité d'acheter un abonnement HTML G et d'accéder à des fonctionnalités encore plus professionnelles. En utilisant la version gratuite de HTML Cleaner, vous acceptez d'inclure des liens dans les documents édités. Cet outil de nettoyage peut ajouter un lien promotionnel tiers à la fin des documents nettoyés et vous devez laisser ce code inchangé tant que vous utilisez la version gratuite.

Bonjour!

Lors de l'écriture de mon propre éditeur WYSIWYG, j'ai rencontré un problème pour copier du texte à partir de Word. Il y a en fait trois problèmes :

  • Word insère beaucoup de code HTML inutile qui doit être nettoyé
  • Pour une raison quelconque, Word utilise des paragraphes au lieu des balises UL et LI pour présenter les listes
  • En fait, comment déterminer que le texte inséré est inséré à partir de Word.
De manière générale, pour résoudre ces problèmes, un plugin jquery a été écrit dont le code source complet est disponible en fin d'article. Exemple d'utilisation :

$('#éditeur'). msword_html_filter();
Le plugin est accroché à un événement touche et vérifie si le code source à l'intérieur de l'éditeur est collé depuis Word ; si c'est le cas, la fonction de nettoyage est lancée. Dans le code HTML résultant, tout ce qui est possible est ajouté - espaces insécables, attributs style Et aligner, Mots clés portée, Tous Mso-classes, paragraphes vides.

Détails d'implantation sous la coupe.

La plupart des habitués utilisés provenaient de TinyMCE.

Comment déterminer si une ligne contient du code html inséré depuis Word :

Si (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w:WordDocument/i.test(content)) ( ... )

Fonction de nettoyage de code (un objet éditeur jquery est passé à la fonction) :

Function word_filter(editor)( var content = editor.html(); // Commentaires de mots comme les commentaires conditionnels, etc. content = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|meta|link|style|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Convertir dans <(\/?)s>/gi,"<$1strike> ___ ([\s\u00a0]*)<\/span>/gi, function(str, espaces) ( return (spaces.length > "; if (/^\s*\w+\./.test(txt)) ( var matches = /()\./.exec(txt ); if (correspondances) ( var start = parseInt(matches, 10); list_tag = start>1 ? "" : ""; )else( list_tag = ""; ) ) if(cur_level> " + $(this).html() + "") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", editor).removeAttr("style"); $("", editor).removeAttr( "align"); $("span", éditeur).replaceWith(function() (return $(this).contents();)); $("span:empty", editor).remove(); , éditeur).removeAttr("class"); $("p:empty", éditeur).remove();

Le texte source complet du plugin se trouve sous le spoiler, enregistrez-le dans un fichier jquery.msword_html_filter.js

texte source du plugin

(function($) ( $.fn.msword_html_filter = function(options) ( var settings = $.extend((), options); function word_filter(editor)( var content = editor.html(); // Commentaires de mots comme commentaires conditionnels, etc. content = content.replace(//gi, ""); // Supprimez les commentaires, les scripts (par exemple, msoShowComment), la balise XML, le contenu VML, // les balises d'espace de noms MS Office et quelques autres balises content = content.replace(/<(!|script[^>]*>.*?<\/script(?=[>\s])|\/?(\?xml(:\w+)?|img|meta|link|style|\w:\w+)(?=[\s\/>]))[^>]* >>gi, ""); // Convertir dans pour le contenu en ligne = content.replace(/<(\/?)s>/gi,"<$1strike>"); // Remplacez les entités nbsp par char car c'est plus facile à gérer //content = content.replace(/ /gi, "\u00a0"); content = content.replace(/ /gi, " "); // Convertir ___à une chaîne d'espaces // sécables/insécables alternés de même longueur content = content.replace(/ ([\s\u00a0]*)<\/span>/gi, function(str, espaces) ( return (spaces.length > 0) ? space.replace(/./, " ").slice(Math.floor(spaces.length/2)).split("") .join("\u00a0") : "" )); éditeur.html(contenu); // Analyser le niveau d'indentation de la liste pour les listes $("p", editor).each(function())( var str = $(this).attr("style"); var matches = /mso-list:\w+ \ w+(+)/.exec(str); if (matches) ( $(this).data("_listLevel", parseInt(matches, 10)); ) )); // Analyser les listes var last_level=0; var pnt = nul ; $("p", editor).each(function())( var cur_level = $(this).data("_listLevel"); if(cur_level != undefined)( var txt = $(this).text() ; var list_tag = ""; if (/^\s*\w+\./.test(txt)) ( var matches = /()\./.exec(txt); if (correspond) ( var start = parseInt ( matches, 10); list_tag = start>1 ? "" : ""; list_tag = ""; if(cur_level>last_level)( if(last_level==0)( $(this).before(list_tag ); pnt = $(this).prev(); )else( pnt = $(list_tag).appendTo(pnt); ) ) if(cur_level " + $(this).html() + "") $(this).remove(); last_level = cur_level; )else( last_level = 0; ) )) $("", editor).removeAttr("style"); $("", editor).removeAttr( "align"); $("span", éditeur).replaceWith(function() (return $(this).contents();)); $("span:empty", editor).remove(); , editor).removeAttr("class"); $("p:empty", editor).remove(); return this.each(function() ( $(this).on("keyup", function ()( var content = $(this).html(); if (/class="?Mso|style="[^"]*\bmso-|style="[^""]*\bmso-|w :WordDocument/ i.test(content)) ( word_filter($(this)); ) ));


Les performances ont été testées uniquement dans la dernière version de Firefox.

Cleaner est un service permettant de nettoyer les balises des « déchets » qui restent dans le document après avoir enregistré la page au format du programme.

Il y a longtemps, j'ai écrit un plugin similaire, mais il a été réalisé à la hâte, maintenant le mécanisme a été complètement réécrit.

Le nettoyage du code s'effectue en recherchant dans la ligne saisie à partir de laquelle une nouvelle est formée, contenant un « clean » . Le plugin supprime absolument tout des balises, y compris . Dans les balises non appariées, le symbole / (slash) est inséré. Les balises vides sont supprimées, par exemple la construction sera supprimée car elle ne contient rien.

Comment fonctionne le nettoyeur HTML ?

Il existe deux manières :

  1. Dans MS Word, sélectionnez les données que vous souhaitez effacer, pour tout sélectionner, appuyez sur Ctrl + A. Collez le texte copié dans le champ ci-dessous (l'onglet « Coller les données MS Office » doit être sélectionné), cliquez sur le bouton « Terminer ».
  2. Avant d'optimiser le code, sélectionnez « Enregistrer sous... » dans Word, puis sélectionnez le type de fichier « Page Web avec filtre », puis ouvrez le fichier enregistré dans un éditeur de texte, copiez le code et collez-le dans le champ ci-dessous (le L'onglet "Insérer HTML" doit être sélectionné "), cliquez sur le bouton "Terminé".

En conséquence, vous recevrez un code HTML vierge.
Les attributs suivants restent intacts :

"colspan", "rowspan", "href", "src", "type", "value", "lang", "tabindex", "title", "code", "alt", "target", "dir" ", " durée ", " action ", " méthode "

Bonne journée, chers lecteurs ! J'espère que vous allez aussi bien que nous : le soleil brille, les oiseaux chantent, il fait chaud et l'été est arrivé ! Je travaille toujours sur ma thèse, donc depuis un mois et demi je n'écris qu'une fois par semaine, je n'ai physiquement pas le temps. Mais ne parlons pas de choses tristes, passons aux choses sérieuses !

Il était une fois, je cherchais sur Internet pour trouver un script qui efface le code HTML des ordures, ce qui, en particulier, nous laisse tous « bien-aimés » à cet égard, Microsoft Word. Auparavant, j'utilisais Nettoyage du code à l'aide d'Adobe Dreamweaver mais il avait deux inconvénients:

    Parfois, cela ne nettoie pas tout ce que nous souhaiterions.

    S'il y a une très grande quantité de code, le script de nettoyage génère une erreur.

Le deuxième point est devenu critique pour moi, car je devais travailler avec de grands tableaux HTML, dont il était impossible de s'éloigner d'un site, et ils fournissaient toutes les informations dans Word.

Ainsi, après avoir longtemps erré sur Internet, j'ai trouvé un script qui gère toute cette gestion avec brio, et en même temps est entièrement personnalisable.

Excel/Word to HTML est un outil idéal pour éditer le code source des articles WordPress ou tout autre système de gestion de contenu lorsque leur compositeur intégré ne fournit pas toutes les fonctions dont nous avons besoin. Composez du contenu directement dans la fenêtre de votre navigateur sans installer d'extension ou de plugin pour gérer la coloration syntaxique et d'autres fonctionnalités d'édition de texte.

Comment utiliser?

Collez le document que vous souhaitez convertir dans l'éditeur Word, puis accédez à la visionneuse HTML en utilisant les grands onglets en haut de la page pour générer le code.

Nettoyez le balisage sale avec un gros bouton qui exécute les options actives (cochées) dans une liste. Vous pouvez également appliquer ces fonctions une par une à l'aide de l'icône CLEAN.

Problèmes de conversion facilement résolus par notre convertisseur HTML en ligne

Le problème de la conversion de Word en HTML a probablement toujours existé avec Microsoft Word. Un grand nombre de styles attribués aux textes, tels que mso-spacerun:yes, et aux classes, telles que MsoNormal, ainsi qu'un fouillis de toutes sortes de span style="font-size:10.0pt" encombrent considérablement le code. Et ils interrompent souvent les styles natifs spécifiés sur le site. Si vous pouvez toujours gérer du texte simple en insérant du texte via le bouton "Insérer du texte uniquement" de l'éditeur, cette méthode ne fonctionnera pas avec les tableaux. Notre convertisseur est capable de nettoyer facilement tous les commentaires et styles inutiles du futur fichier HTML, en cliquant simplement sur les boutons.


Nettoyage en ligne du HTML des styles CSS inutiles
  • Supprimez tous les styles inutiles de tout le texte ou d'un fragment sélectionné
  • Nous supprimons les codes d'indentation, symboles et autres codes Unicode inutiles
  • Nettoyez le code des espaces supplémentaires et des balises en double
  • Si nécessaire, supprimez complètement le balisage HTML.

Convertissez des fichiers Word, Excel, TxT en code source HTML propre. Sans styles ni commentaires inutiles pour une insertion directe et correcte dans les pages du site.

Formats pris en charge pour la conversion en ligne :

  • 97-2004 et versions ultérieures DOC vers HTML, DOCX vers HTML ;
  • XLS vers HTML, XLSX vers HTML ;
  • PPT en HTML, PPTX en HTML ;
  • TXT vers HTML et bien d’autres formats.

Une autre utilisation utile du service, au lieu de passer des heures à créer un tableau en HTML, créez-le en 15 minutes dans Excel ou Word et convertissez-le en un beau code HTML propre à insérer dans le site.



2024 wisemotors.ru. Comment ça fonctionne. Fer. Exploitation minière. Crypto-monnaie.