我是如何阅读 md-loader 源码并优化它的?

前端三元同学

共 16227字,需浏览 33分钟

 · 2021-11-17

背景

相信很多同学在学习 webpack 的时候,对 loader 的概念应该有所了解,它用于模块源码的转换,描述了 webpack 如何处理非 JavaScript 模块,常见的有 css-loaderbabel-loaderurl-loadervue-loader 等。

大部分 loader 已经满足我们的日常开发需求,不过有些时候我们仍然需要自定义 loader。为了让你了解如何开发一个 webpack loader,我决定从 ElementUI 组件库的 md-loader 入手,带你去了解其中的实现原理,以及在它的基础上,如何做进一步的优化。

文档的设计

对于一个组件的文档,首先我们要考虑的是如何更好地展现组件的功能,其次要考虑的是如何更方便地做文档维护。

想要编写好一个组件的文档,需要做好以下几点:

1.功能描述

对组件功能、使用场景做详细的描述。

2.demo 演示

直观地让用户感受到组件的功能,并且能展示 demo 对应的代码。

3.接口说明

写清楚组件支持的属性、方法、事件等。

那么,如何方便地维护文档呢?

ElementUI 组件库的文档也是一个 Vue 项目,组件的文档页面是单独的路由视图,而文档是用 markdown 文件来描述的,在文档内部,不仅包含了对组件的功能以及接口的描述,还可以通过编写 vue 组件的方式直接编写组件的 demo,这种方式对于组件文档的维护还是比较方便的。

以 ElementUI 组件库 Alter 组件为例:

## Alert 警告

用于页面中展示重要的提示信息。

### 基本用法

页面中的非浮层元素,不会自动消失。

:::demo Alert 组件提供四种主题,由`type`属性指定,默认值为`info`

```html

```

:::

最终它在页面上的展示效果如下:

可以看到,组件的路由视图对应的是一个 markdown 文件,而在我们通常的认知中,Vue 的路由视图应该对应的是一个 Vue 组件。

在 ElementUI 内部,是通过 require.ensure 的方式去加载一个 .md 文件,它的返回值会作为路由视图对应的异步组件。

const LOAD_DOCS_MAP = {
  'zh-CN'path => {
    return r => require.ensure([], () =>
      r(require(`./docs/zh-CN${path}.md`)),
    'zh-CN');
  },
  // ...
}  

因此内部就必须要把 markdown 文件转换一个 Vue 组件,我们可以借助 webpack loader 来实现这一需求。

自定义 md-loader

首先,在 webpack 的配置规则中,需要指定 .md 文件应用的 loader:

{
  test/\.md$/,
  use: [
    {
      loader'vue-loader',
      options: {
        compilerOptions: {
          preserveWhitespacefalse
        }
      }
    },
    {
      loader: path.resolve(__dirname, './md-loader/index.js')
    }
  ]
}

接下来,我们就来分析 md-loader 的源码实现:

const {
  stripScript,
  stripTemplate,
  genInlineComponentText
} = require('./util');
const md = require('./config');

module.exports = function(source{
  const content = md.render(source);

  const startTag = '';
  const endTagLen = endTag.length;

  let componenetsString = '';
  let id = 0// demo 的 id
  let output = []; // 输出的内容
  let start = 0// 字符串开始位置

  let commentStart = content.indexOf(startTag);
  let commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  while (commentStart !== -1 && commentEnd !== -1) {
    output.push(content.slice(start, commentStart));

    const commentContent = content.slice(commentStart + startTagLen, commentEnd);
    const html = stripTemplate(commentContent);
    const script = stripScript(commentContent);
    let demoComponentContent = genInlineComponentText(html, script);
    const demoComponentName = `element-demo${id}`;
    output.push(`<${demoComponentName} />`);
    componenetsString += `${JSON.stringify(demoComponentName)}${demoComponentContent},`;

    // 重新计算下一次的位置
    id++;
    start = commentEnd + endTagLen;
    commentStart = content.indexOf(startTag, start);
    commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  }

  // 仅允许在 demo 不存在时,才可以在 Markdown 中写 script 标签
  let pageScript = '';
  if (componenetsString) {
    pageScript = ``;
  } else if (content.indexOf('') + ''.length;
    pageScript = content.slice(0, start);
  }

  output.push(content.slice(start));

  return `
    
    ${pageScript}
  `
;
};

md-loader 要做的事情,就是把 markdown 语法的字符串,转成 Vue 组件字符串。转换的过程可以拆成三个步骤:markdown 渲染,demo 子组件的处理,构造完整的组件。接下来我们就来依次分析这三个步骤。

markdown 渲染

markdown 文件内容会渲染生成对应的 HTML,它是通过下面这段代码完成的:

const md = require('./config');
module.exports = function(source{
  const content = md.render(source);
}

md 对象的来源如下:

const Config = require('markdown-it-chain');
const anchorPlugin = require('markdown-it-anchor');
const slugify = require('transliteration').slugify;
const containers = require('./containers');
const overWriteFenceRule = require('./fence');

const config = new Config();

config.options.html(true).end()
  .plugin('anchor').use(anchorPlugin, [
    {
      level2,
      slugify: slugify,
      permalinktrue,
      permalinkBeforetrue
    }
  ]).end()
  .plugin('containers').use(containers).end();

const md = config.toMd();
overWriteFenceRule(md);

module.exports = md;

首先实例化了 config 对象,它依赖于 markdown-it-chain,通过 webpack chain 的链式 API,配置了 markdown-it 的插件。而 md 对象指向的就是 markdown-it 的实例。

markdown-it 的实例提供了很多 API,具体可以参考它的官网文档。其中 md.render 就是把 markdown 字符串渲染生成 HTML。

不过我们注意到,组件文档使用了一些非标准的 markdown 语法,比如:

:::demo
:::

它实际上是一个 markdown 的自定义容器,借助于 markdown-it-container 插件,就可以解析这个自定义容器:

const mdContainer = require('markdown-it-container');

module.exports = md => {
  md.use(mdContainer, 'demo', {
    validate(params) {
      return params.trim().match(/^demo\s*(.*)$/);
    },
    render(tokens, idx) {
      const m = tokens[idx].info.trim().match(/^demo\s*(.*)$/);
      if (tokens[idx].nesting === 1) {
        const description = m && m.length > 1 ? m[1] : '';
        const content = tokens[idx + 1].type === 'fence' ? tokens[idx + 1].content : '';
        return `
        ${description ? `
${md.render(description)}
`
 : ''}

        
        `
;
      }
      return '';
    }
  });

  md.use(mdContainer, 'tip');
  md.use(mdContainer, 'warning');
};

可以看到,对于 demo 这个自定义容器,它会解析 demo 后面紧接着的描述字符串以及 code fence,并生成新的 HTML 字符串。

此外,code fence 也定义了新的渲染策略:

// 覆盖默认的 fence 渲染策略
module.exports = md => {
  const defaultRender = md.renderer.rules.fence;
  md.renderer.rules.fence = (tokens, idx, options, env, self) => {
    const token = tokens[idx];
    // 判断该 fence 是否在 :::demo 内
    const prevToken = tokens[idx - 1];
    const isInDemoContainer = prevToken && prevToken.nesting === 1 && prevToken.info.trim().match(/^demo\s*(.*)$/);
    if (token.info === 'html' && isInDemoContainer) {
      return `${md.utils.escapeHtml(token.content)}
`;
    }
    return defaultRender(tokens, idx, options, env, self);
  };
};

对于在 demo 容器内且带有 html 标记的 code fence,会做一层特殊处理。

对于我们前面的示例:

:::demo Alert 组件提供四种主题,由`type`属性指定,默认值为`info`

```html

```

:::

经过解析后,生成的 HTML 大致如下:

<demo-block>
  <div><p>Alert 组件提供四种主题,由<code>typecode>属性指定,默认值为<code>infocode>。p>
  div>
  
  <template slot="highlight"><pre v-pre><code class="html"><template>
  <el-alert
    title="成功提示的文案"
    type="success">
  </el-alert>
  <el-alert
    title="消息提示的文案"
    type="info">
  </el-alert>
  <el-alert
    title="警告提示的文案"
    type="warning">
  </el-alert>
  <el-alert
    title="错误提示的文案"
    type="error">
  </el-alert>
  </template>
  code>pre>template>
demo-block>

demo 子组件的处理

目前我们了解到,每一个 demo 容器对应一个示例,它会解析生成对应的 HTML,最终会通过 demo-block 组件渲染,这个组件是预先定义好的 Vue 组件:

<template>
  <div
    class="demo-block"
    :class="[blockClass, { 'hover': hovering }]"
    @mouseenter="hovering = true"
    @mouseleave="hovering = false">

    <div class="source">
      <slot name="source">slot>
    div>
    <div class="meta" ref="meta">
      <div class="description" v-if="$slots.default">
        <slot>slot>
      div>
      <div class="highlight">
        <slot name="highlight">slot>
      div>
    div>
    <div
      class="demo-block-control"
      ref="control"
      :class="{ 'is-fixed': fixedControl }"
      @click="isExpanded = !isExpanded">

      <transition name="arrow-slide">
        <i :class="[iconClass, { 'hovering': hovering }]">i>
      transition>
      <transition name="text-slide">
        <span v-show="hovering">{{ controlText }}span>
      transition>
      <el-tooltip effect="dark" :content="langConfig['tooltip-text']" placement="right">
        <transition name="text-slide">
          <el-button
            v-show="hovering || isExpanded"
            size="small"
            type="text"
            class="control-button"
            @click.stop="goCodepen">

            {{ langConfig['button-text'] }}
          el-button>
        transition>
      el-tooltip>
    div>
  div>
template>

demo-block 支持了多个插槽,其中默认插槽对应了组件的描述部分;highlight 插槽对应组件高亮的代码部分;source 插槽对应 demo 实现的部分。

因此,目前我们生成的 HTML 字符串还不能够直接被 demo-block 组件使用,需要进一步的处理:

module.exports = function(source{
  const content = md.render(source);

  const startTag = '';
  const endTagLen = endTag.length;

  let componenetsString = '';
  let id = 0// demo 的 id
  let output = []; // 输出的内容
  let start = 0// 字符串开始位置

  let commentStart = content.indexOf(startTag);
  let commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  while (commentStart !== -1 && commentEnd !== -1) {
    output.push(content.slice(start, commentStart));

    const commentContent = content.slice(commentStart + startTagLen, commentEnd);
    const html = stripTemplate(commentContent);
    const script = stripScript(commentContent);
    let demoComponentContent = genInlineComponentText(html, script);
    const demoComponentName = `element-demo${id}`;
    output.push(`<${demoComponentName} />`);
    componenetsString += `${JSON.stringify(demoComponentName)}${demoComponentContent},`;

    // 重新计算下一次的位置
    id++;
    start = commentEnd + endTagLen;
    commentStart = content.indexOf(startTag, start);
    commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  }
  
  // 处理 script
  // ...
  
  output.push(content.slice(start))
};

其中 output 表示要输出的模板内容,componenetsString 表示要输出的脚本内容。这段代码要做的事情就是填充 demo-block 组件内部的 source 插槽,并且插槽的内容是一个 demo 子组件。

由于前面生成的 HTML 中包含了 注释字符串,因此就可以找到注释字符串的位置,通过字符串截取的方式来获取注释内外的内容。

对于注释内的内容,会提取其中的模板部分和 JS 部分,然后构造出一个内联的组件字符串。

前面的示例经过处理,output 对应的内容如下:

[
  `
     

Alert 组件提供四种主题,由type属性指定,默认值为info

`
,
  ``
  `<template>
     <el-alert
       title="成功提示的文案"
       type="success">
     </el-alert>
     <el-alert
       title="消息提示的文案"
       type="info">
     </el-alert>
     <el-alert
       title="警告提示的文案"
       type="warning">
     </el-alert>
     <el-alert
       title="错误提示的文案"
       type="error">
     </el-alert>
     </template>
     

     `
]

处理后的 demo-block 就变成一个标准的 Vue 组件的应用了。

componenetsString 对应的内容如下:

`"element-demo0": (function() {
  var render = function() {
    var _vm = this
    var _h = _vm.$createElement
    var _c = _vm._self._c || _h
    return _c(
      "div",
      [
        [
          _c("el-alert", { attrs: { title: "成功提示的文案", type: "success" } }),
          _vm._v(" "),
          _c("el-alert", { attrs: { title: "消息提示的文案", type: "info" } }),
          _vm._v(" "),
          _c("el-alert", { attrs: { title: "警告提示的文案", type: "warning" } }),
          _vm._v(" "),
          _c("el-alert", { attrs: { title: "错误提示的文案", type: "error" } })
        ]
      ],
      2
    )  
  }  
  var staticRenderFns = []
  render._withStripped = true
  const democomponentExport = {}
  return {
    render,
    staticRenderFns,
    ...democomponentExport
  }
})(),`

通过内联的方式定义了 element-demo0 子组件的实现。

示例只是处理了单个 demo 子组件,如果有多个 demo 容器,就可以通过循环查找注释字符串 element-demo:,处理所有的 demo-block

构造完整的组件

module.exports = function(source{
  const content = md.render(source);

  let componenetsString = '';
  let output = [];
  let start = 0;

  // 循环处理 demo 子组件
  // ...
  
  let pageScript = '';
  if (componenetsString) {
    pageScript = ``;
  } else if (content.indexOf('') + ''.length;
    pageScript = content.slice(0, start);
  }

  output.push(content.slice(start));

  return `
    
    ${pageScript}
  `
;
};

可以看到,output 负责组件的模板定义,pageScript 负责组件的脚本定义,最终会通过字符串拼接的方式,返回完整的组件定义。

对于最开始完整的示例而言,经过 md-loader 处理的结果如下:

<template>
  <section class="content element-doc">
    <h2 id="alert-jing-gao"><a class="header-anchor" href="#alert-jing-gao" aria-hidden="true">a> Alert 警告h2>
    <p>用于页面中展示重要的提示信息。p>
    <h3 id="ji-ben-yong-fa"><a class="header-anchor" href="#ji-ben-yong-fa" aria-hidden="true">a> 基本用法h3>
    <p>页面中的非浮层元素,不会自动消失。p>
    <demo-block>
      <div><p>Alert 组件提供四种主题,由<code>typecode>属性指定,默认值为<code>infocode>。p>
      div>
      <template slot="source">
        <element-demo0/>
      template>
      <template slot="highlight"><pre v-pre><code class="html"><template>
          <el-alert
            title="成功提示的文案"
            type="success">
          </el-alert>
          <el-alert
            title="消息提示的文案"
            type="info">
          </el-alert>
          <el-alert
            title="警告提示的文案"
            type="warning">
          </el-alert>
          <el-alert
            title="错误提示的文案"
            type="error">
          </el-alert>
        </template>
        code>pre>
      template>
    demo-block>
  section>
template>
<script>
  export default {
    name'component-doc',
    components: {
      "element-demo0": (function({
        var render = function({
          var _vm = this
          var _h = _vm.$createElement
          var _c = _vm._self._c || _h
          return _c(
            "div",
            [
              [
                _c("el-alert", { attrs: { title"成功提示的文案"type"success" } }),
                _vm._v(" "),
                _c("el-alert", { attrs: { title"消息提示的文案"type"info" } }),
                _vm._v(" "),
                _c("el-alert", { attrs: { title"警告提示的文案"type"warning" } }),
                _vm._v(" "),
                _c("el-alert", { attrs: { title"错误提示的文案"type"error" } })
              ]
            ],
            2
          )
        }
        var staticRenderFns = []
        render._withStripped = true

        const democomponentExport = {}
        return {
          render,
          staticRenderFns,
          ...democomponentExport
        }
      })(),
    }
  }
script>

显然,经过 md-loader 处理后原来 markdown 语法的字符串变成了一个 Vue 组件定义的字符串,就可以交给 vue-loader 继续处理了。

文档的优化

ElementUI 文档的设计确实巧妙,由于我们研发的 ZoomUI 是 fork 自 ElementUI 的,很长一段时间,我们也沿用了 ElementUI 文档的编写方式。

但是随着我们自研的组件越来越多,组件使用的场景也越来越丰富,我们对于文档编写和维护的需求也越来越多。

我发现在现有模式下写文档有几个不爽的点:

1.在 .md 中写 Vue 组件不方便,没法格式化代码,IDE 的智能提示不够友好。

2.在 demo 中写 style 是无效的,需要在外部的 css 文件另外定义样式。

3.中英文文档需要分别写 demo,修改一处没法自动同步到另一处。

我认为理想中编写一个组件的文档的方式是这样的:

## Select 选择器

当选项过多时,使用下拉菜单展示并选择内容。

### 基础用法

适用广泛的基础单选。

:::demo `v-model` 的值为当前被选中的 `zm-option` 的 `value` 属性值。

```html

```

:::

### 有禁用选项

:::demo 在 `zm-option` 中,设定 `disabled` 值为 `true`,即可禁用该选项。
```html

```

:::

所有组件的 demo 拆成一个个 Vue 组件,然后在 markdown 文档中引入这些同名的组件。通过这种方式,前面提到的三个痛点就解决了。

那么,想达到这种效果,我们需要对 md-loader 做哪些修改呢?

来看一下修改后的 md-loader 的实现:

const md = require('./config');

module.exports = function(source{
  const content = md.render(source, {
    resourcePaththis.resourcePath
  });

  const startTag = '';
  const endTagLen = endTag.length;
  const tagReg = /\s*<([\w-_]+)\s*\/>\s*/;

  let componenetsString = '';
  let output = []; // 输出的内容
  let start = 0// 字符串开始位置

  let commentStart = content.indexOf(startTag);
  let commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  while (commentStart !== -1 && commentEnd !== -1) {
    output.push(content.slice(start, commentStart));

    const commentContent = content.slice(commentStart + startTagLen, commentEnd);
    const matches = commentContent.match(tagReg);
    if (matches) {
      const demoComponentName = matches[1];
      output.push(`<${demoComponentName} />`);
      const imports = `()=>import('../demos/${demoComponentName}.vue')`;
      componenetsString += `${JSON.stringify(demoComponentName)}${imports},`;
    }
    start = commentEnd + endTagLen;
    commentStart = content.indexOf(startTag, start);
    commentEnd = content.indexOf(endTag, commentStart + startTagLen);
  }

  let pageScript = '';
  if (componenetsString) {
    pageScript = ``;
  } else if (content.indexOf('') + ''.length;
    pageScript = content.slice(0, start);
  }

  output.push(content.slice(start));
  return `
    
    ${pageScript}
  `
;
};

思路很简单,解析出每个 demo 容器中的组件名称,通过动态 import 的方式加载组件,然后在 source 插槽中直接用这个组件。

这样就把组件的 markdown 文档和 demo 直接关联起来。但这样还不够,我们还需要解决组件 demo 下面的代码展示问题,需要对 code fence 渲染策略做一定的修改:

const path = require('path');
const fs = require('fs');

const tagReg = /\s*<([\w-_]+)\s*\/>\s*/;

// 覆盖默认的 fence 渲染策略
module.exports = md => {
  const defaultRender = md.renderer.rules.fence;
  md.renderer.rules.fence = (tokens, idx, options, env, self) => {
    const token = tokens[idx];
    // 判断该 fence 是否在 :::demo 内
    const prevToken = tokens[idx - 1];
    const isInDemoContainer = prevToken && prevToken.nesting === 1 && prevToken.info.trim().match(/^demo\s*(.*)$/);
    if (token.info === 'html' && isInDemoContainer) {
      const matches = token.content.match(tagReg);
      if (matches) {
        const componentName = matches[1];
        const componentPath = path.resolve(env.resourcePath, `../../demos/${componentName}.vue`);
        const content = fs.readFileSync(componentPath, 'utf-8');
        return `${md.utils.escapeHtml(content)}
`;
      }
      return '';
    }
    return defaultRender(tokens, idx, options, env, self);
  };
};

由于组件 demo 的代码已经不在 markdown 文档中维护了,因此只能从组件文件中读取了。

但是我们如何知道应该从哪个路径读取对应的 demo 组件呢?

在 webpack loader 中,我们可以通过 this.resourcePath 获取到当前处理文件的路径,那么在执行 markdown 渲染的过程中就可以把路径当做环境变量传入:

const content = md.render(source, {
  resourcePaththis.resourcePath
})

这样在 markdown 处理器的内部我们就可以通过 env.resourcePath 拿到处理的 markdown 文件路径,从而通过相对路径计算出要读取组件的路径,然后读取它们的内容:

const componentPath = path.resolve(env.resourcePath, `../../demos/${componentName}.vue`);
const content = fs.readFileSync(componentPath, 'utf-8');

有了组件文档的重构方案,接下来的工作就是依次重构组件的文档。当然在这个阶段,新老文档编写的方式都需要支持。

因此需要对 webpack 的配置做一些修改:

{
  test/examples(\/|\\)docs(\/|\\).*\.md$/,
  use: [
    {
      loader'vue-loader',
      options: {
        compilerOptions: {
          preserveWhitespacefalse
        }
      }
    },
    {
      loader: path.resolve(__dirname, './md-loader/index.js')
    }
  ]
}, {
  test/(examples(\/|\\)docs-next(\/|\\).*|changelog\.[\w-_]+)\.md$/i,
  use: [
    {
      loader'vue-loader',
      options: {
        compilerOptions: {
          preserveWhitespacefalse
        }
      }
    },
    {
      loader: path.resolve(__dirname, './md-loader-next/index.js')
    }
  ]
}

对于重构的文档,使用新的 markdown loader。当然加载组件视图的逻辑也需要做一定的修改,对于重构的文档,指向新的文档地址。

总结

ElementUI 通过 markdown 编写组件文档的思路还是非常棒的,主要利用了自定义 md-loader 对 markdown 文件内容做了一层处理,解析成 Vue 组件字符串,再交给 vue-loader 处理。

在写这篇文章之前,我就在粉丝群里分享了重构文档的方案。有同学告诉我,Element-plus 已经用 vitepress 重写,看了一下文档的组织方式,和我重构的方式非常类似,这就是传说中的英雄所见略同吗?

我在之前的文章中强调过,要善于发现工作中的痛点,并通过技术的方式解决,这是优秀的工程师重要的能力之一,希望这篇文章能够带给你这方面的一些思考。

参考资料

[1] markdown-it-chain:  https://github.com/ulivz/markdown-it-chain
[2] markdown-it: https://markdown-it.github.io/markdown-it/

浏览 27
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报