gball个人知识库
首页
基础组件
基础知识
算法&设计模式
  • 操作手册
  • 数据库
  • 极客时间
  • 每日随笔
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
  • 画图工具 (opens new window)
关于
  • 网盘 (opens new window)
  • 分类
  • 标签
  • 归档
项目
GitHub (opens new window)

ggball

后端界的小学生
首页
基础组件
基础知识
算法&设计模式
  • 操作手册
  • 数据库
  • 极客时间
  • 每日随笔
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
  • 画图工具 (opens new window)
关于
  • 网盘 (opens new window)
  • 分类
  • 标签
  • 归档
项目
GitHub (opens new window)
  • 面试

  • 数据库

  • linux

  • node

  • tensorFlow

  • 基础组件

  • 基础知识

  • 算法与设计模式

  • 分布式

  • 疑难杂症

  • go学习之旅

  • 极客时间

    • 设计模式之美

      • 开篇词 (1讲)

      • 设计模式学习导读 (3讲)

      • 设计原则与思想:面向对象 (11讲)

      • 设计原则与思想:设计原则 (12讲)

      • 设计原则与思想:规范与重构 (11讲)

      • 设计原则与思想:总结课 (3讲)

      • 设计模式与范式:创建型 (7讲)

      • 设计模式与范式:结构型 (8讲)

        • 代理模式:代理在RPC、缓存、监控等场景中的应用
        • 桥接模式:如何实现支持不同类型和渠道的消息推送系统?
        • 装饰器模式:通过剖析JavaIO类库源码学习装饰器模式
        • 适配器模式:代理、适配器、桥接、装饰,这四个模式有何区别?
        • 门面模式:如何设计合理的接口粒度以兼顾接口的易用性和通用性?
        • 组合模式:如何设计实现支持递归遍历的文件系统目录树结构?
          • 组合模式的原理与实现
          • 组合模式的应用场景举例
          • 重点回顾
          • 课堂讨论
          • 精选评论
        • 享元模式(上):如何利用享元模式优化文本编辑器的内存占用?
        • 享元模式(下):剖析享元模式在JavaInteger、String中的应用
      • 设计模式与范式:行为型 (18讲)

      • 设计模式与范式:总结课 (2讲)

      • 开源与项目实战:开源实战 (14讲)

      • 开源与项目实战:项目实战 (9讲)

      • 开源与项目实战:总结课 (2讲)

      • 不定期加餐 (11讲)

      • 结束语 (1讲)

    • Redis核心技术与实战

组合模式:如何设计实现支持递归遍历的文件系统目录树结构?

# 53 | 组合模式:如何设计实现支持递归遍历的文件系统目录树结构?

结构型设计模式就快要讲完了,还剩下两个不那么常用的:组合模式和享元模式。今天,我们来讲一下组合模式(CompositeDesignPattern)。

组合模式跟我们之前讲的面向对象设计中的“组合关系(通过组合来组装两个类)”,完全是两码事。这里讲的“组合模式”,主要是用来处理树形结构数据。这里的“数据”,你可以简单理解为一组对象集合,待会我们会详细讲解。

正因为其应用场景的特殊性,数据必须能表示成树形结构,这也导致了这种模式在实际的项目开发中并不那么常用。但是,一旦数据满足树形结构,应用这种模式就能发挥很大的作用,能让代码变得非常简洁。

话不多说,让我们正式开始今天的学习吧!

# 组合模式的原理与实现

在GoF的《设计模式》一书中,组合模式是这样定义的:

翻译成中文就是:将一组对象组织(Compose)成树形结构,以表示一种“部分-整体”的层次结构。组合让客户端(在很多设计模式书籍中,“客户端”代指代码的使用者。)可以统一单个对象和组合对象的处理逻辑。

接下来,对于组合模式,我举个例子来给你解释一下。

假设我们有这样一个需求:设计一个类来表示文件系统中的目录,能方便地实现下面这些功能:

  • 动态地添加、删除某个目录下的子目录或文件;

  • 统计指定目录下的文件个数;

  • 统计指定目录下的文件总大小。

我这里给出了这个类的骨架代码,如下所示。其中的核心逻辑并未实现,你可以试着自己去补充完整,再来看我的讲解。在下面的代码实现中,我们把文件和目录统一用FileSystemNode类来表示,并且通过isFile属性来区分。

public class FileSystemNode {
  private String path;
  private boolean isFile;
  private List<FileSystemNode> subNodes = new ArrayList<>();

  public FileSystemNode(String path, boolean isFile) {
    this.path = path;
    this.isFile = isFile;
  }

  public int countNumOfFiles() {
    // TODO:...
  }

  public long countSizeOfFiles() {
    // TODO:...
  }

  public String getPath() {
    return path;
  }

  public void addSubNode(FileSystemNode fileOrDir) {
    subNodes.add(fileOrDir);
  }

  public void removeSubNode(FileSystemNode fileOrDir) {
    int size = subNodes.size();
    int i = 0;
    for (; i < size; ++i) {
      if (subNodes.get(i).getPath().equalsIgnoreCase(fileOrDir.getPath())) {
        break;
      }
    }
    if (i < size) {
      subNodes.remove(i);
    }
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

实际上,如果你看过我的《数据结构与算法之美》专栏,想要补全其中的countNumOfFiles()和countSizeOfFiles()这两个函数,并不是件难事,实际上这就是树上的递归遍历算法。对于文件,我们直接返回文件的个数(返回1)或大小。对于目录,我们遍历目录中每个子目录或者文件,递归计算它们的个数或大小,然后求和,就是这个目录下的文件个数和文件大小。

我把两个函数的代码实现贴在下面了,你可以对照着看一下。

  public int countNumOfFiles() {
    if (isFile) {
      return 1;
    }
    int numOfFiles = 0;
    for (FileSystemNode fileOrDir : subNodes) {
      numOfFiles += fileOrDir.countNumOfFiles();
    }
    return numOfFiles;
  }

  public long countSizeOfFiles() {
    if (isFile) {
      File file = new File(path);
      if (!file.exists()) return 0;
      return file.length();
    }
    long sizeofFiles = 0;
    for (FileSystemNode fileOrDir : subNodes) {
      sizeofFiles += fileOrDir.countSizeOfFiles();
    }
    return sizeofFiles;
  }

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

单纯从功能实现角度来说,上面的代码没有问题,已经实现了我们想要的功能。但是,如果我们开发的是一个大型系统,从扩展性(文件或目录可能会对应不同的操作)、业务建模(文件和目录从业务上是两个概念)、代码的可读性(文件和目录区分对待更加符合人们对业务的认知)的角度来说,我们最好对文件和目录进行区分设计,定义为File和Directory两个类。

按照这个设计思路,我们对代码进行重构。重构之后的代码如下所示:

public abstract class FileSystemNode {
  protected String path;

  public FileSystemNode(String path) {
    this.path = path;
  }

  public abstract int countNumOfFiles();
  public abstract long countSizeOfFiles();

  public String getPath() {
    return path;
  }
}

public class File extends FileSystemNode {
  public File(String path) {
    super(path);
  }

  @Override
  public int countNumOfFiles() {
    return 1;
  }

  @Override
  public long countSizeOfFiles() {
    java.io.File file = new java.io.File(path);
    if (!file.exists()) return 0;
    return file.length();
  }
}

public class Directory extends FileSystemNode {
  private List<FileSystemNode> subNodes = new ArrayList<>();

  public Directory(String path) {
    super(path);
  }

  @Override
  public int countNumOfFiles() {
    int numOfFiles = 0;
    for (FileSystemNode fileOrDir : subNodes) {
      numOfFiles += fileOrDir.countNumOfFiles();
    }
    return numOfFiles;
  }

  @Override
  public long countSizeOfFiles() {
    long sizeofFiles = 0;
    for (FileSystemNode fileOrDir : subNodes) {
      sizeofFiles += fileOrDir.countSizeOfFiles();
    }
    return sizeofFiles;
  }

  public void addSubNode(FileSystemNode fileOrDir) {
    subNodes.add(fileOrDir);
  }

  public void removeSubNode(FileSystemNode fileOrDir) {
    int size = subNodes.size();
    int i = 0;
    for (; i < size; ++i) {
      if (subNodes.get(i).getPath().equalsIgnoreCase(fileOrDir.getPath())) {
        break;
      }
    }
    if (i < size) {
      subNodes.remove(i);
    }
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76

文件和目录类都设计好了,我们来看,如何用它们来表示一个文件系统中的目录树结构。具体的代码示例如下所示:

public class Demo {
  public static void main(String[] args) {
    /**
     * /
     * /wz/
     * /wz/a.txt
     * /wz/b.txt
     * /wz/movies/
     * /wz/movies/c.avi
     * /xzg/
     * /xzg/docs/
     * /xzg/docs/d.txt
     */
    Directory fileSystemTree = new Directory("/");
    Directory node_wz = new Directory("/wz/");
    Directory node_xzg = new Directory("/xzg/");
    fileSystemTree.addSubNode(node_wz);
    fileSystemTree.addSubNode(node_xzg);

    File node_wz_a = new File("/wz/a.txt");
    File node_wz_b = new File("/wz/b.txt");
    Directory node_wz_movies = new Directory("/wz/movies/");
    node_wz.addSubNode(node_wz_a);
    node_wz.addSubNode(node_wz_b);
    node_wz.addSubNode(node_wz_movies);

    File node_wz_movies_c = new File("/wz/movies/c.avi");
    node_wz_movies.addSubNode(node_wz_movies_c);

    Directory node_xzg_docs = new Directory("/xzg/docs/");
    node_xzg.addSubNode(node_xzg_docs);

    File node_xzg_docs_d = new File("/xzg/docs/d.txt");
    node_xzg_docs.addSubNode(node_xzg_docs_d);

    System.out.println("/ files num:" + fileSystemTree.countNumOfFiles());
    System.out.println("/wz/ files num:" + node_wz.countNumOfFiles());
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

我们对照着这个例子,再重新看一下组合模式的定义:“将一组对象(文件和目录)组织成树形结构,以表示一种‘部分-整体’的层次结构(目录与子目录的嵌套结构)。组合模式让客户端可以统一单个对象(文件)和组合对象(目录)的处理逻辑(递归遍历)。”

实际上,刚才讲的这种组合模式的设计思路,与其说是一种设计模式,倒不如说是对业务场景的一种数据结构和算法的抽象。其中,数据可以表示成树这种数据结构,业务需求可以通过在树上的递归遍历算法来实现。

# 组合模式的应用场景举例

刚刚我们讲了文件系统的例子,对于组合模式,我这里再举一个例子。搞懂了这两个例子,你基本上就算掌握了组合模式。在实际的项目中,遇到类似的可以表示成树形结构的业务场景,你只要“照葫芦画瓢”去设计就可以了。

假设我们在开发一个OA系统(办公自动化系统)。公司的组织结构包含部门和员工两种数据类型。其中,部门又可以包含子部门和员工。在数据库中的表结构如下所示:

图片

我们希望在内存中构建整个公司的人员架构图(部门、子部门、员工的隶属关系),并且提供接口计算出部门的薪资成本(隶属于这个部门的所有员工的薪资和)。

部门包含子部门和员工,这是一种嵌套结构,可以表示成树这种数据结构。计算每个部门的薪资开支这样一个需求,也可以通过在树上的遍历算法来实现。所以,从这个角度来看,这个应用场景可以使用组合模式来设计和实现。

这个例子的代码结构跟上一个例子的很相似,代码实现我直接贴在了下面,你可以对比着看一下。其中,HumanResource是部门类(Department)和员工类(Employee)抽象出来的父类,为的是能统一薪资的处理逻辑。Demo中的代码负责从数据库中读取数据并在内存中构建组织架构图。

public abstract class HumanResource {
  protected long id;
  protected double salary;

  public HumanResource(long id) {
    this.id = id;
  }

  public long getId() {
    return id;
  }

  public abstract double calculateSalary();
}

public class Employee extends HumanResource {
  public Employee(long id, double salary) {
    super(id);
    this.salary = salary;
  }

  @Override
  public double calculateSalary() {
    return salary;
  }
}

public class Department extends HumanResource {
  private List<HumanResource> subNodes = new ArrayList<>();

  public Department(long id) {
    super(id);
  }

  @Override
  public double calculateSalary() {
    double totalSalary = 0;
    for (HumanResource hr : subNodes) {
      totalSalary += hr.calculateSalary();
    }
    this.salary = totalSalary;
    return totalSalary;
  }

  public void addSubNode(HumanResource hr) {
    subNodes.add(hr);
  }
}

// 构建组织架构的代码
public class Demo {
  private static final long ORGANIZATION_ROOT_ID = 1001;
  private DepartmentRepo departmentRepo; // 依赖注入
  private EmployeeRepo employeeRepo; // 依赖注入

  public void buildOrganization() {
    Department rootDepartment = new Department(ORGANIZATION_ROOT_ID);
    buildOrganization(rootDepartment);
  }

  private void buildOrganization(Department department) {
    List<Long> subDepartmentIds = departmentRepo.getSubDepartmentIds(department.getId());
    for (Long subDepartmentId : subDepartmentIds) {
      Department subDepartment = new Department(subDepartmentId);
      department.addSubNode(subDepartment);
      buildOrganization(subDepartment);
    }
    List<Long> employeeIds = employeeRepo.getDepartmentEmployeeIds(department.getId());
    for (Long employeeId : employeeIds) {
      double salary = employeeRepo.getEmployeeSalary(employeeId);
      department.addSubNode(new Employee(employeeId, salary));
    }
  }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75

我们再拿组合模式的定义跟这个例子对照一下:“将一组对象(员工和部门)组织成树形结构,以表示一种‘部分-整体’的层次结构(部门与子部门的嵌套结构)。组合模式让客户端可以统一单个对象(员工)和组合对象(部门)的处理逻辑(递归遍历)。”

# 重点回顾

好了,今天的内容到此就讲完了。我们一块来总结回顾一下,你需要重点掌握的内容。

组合模式的设计思路,与其说是一种设计模式,倒不如说是对业务场景的一种数据结构和算法的抽象。其中,数据可以表示成树这种数据结构,业务需求可以通过在树上的递归遍历算法来实现。

组合模式,将一组对象组织成树形结构,将单个对象和组合对象都看做树中的节点,以统一处理逻辑,并且它利用树形结构的特点,递归地处理每个子树,依次简化代码实现。使用组合模式的前提在于,你的业务场景必须能够表示成树形结构。所以,组合模式的应用场景也比较局限,它并不是一种很常用的设计模式。

# 课堂讨论

在文件系统那个例子中,countNumOfFiles()和countSizeOfFiles()这两个函数实现的效率并不高,因为每次调用它们的时候,都要重新遍历一遍子树。有没有什么办法可以提高这两个函数的执行效率呢(注意:文件系统还会涉及频繁的删除、添加文件操作,也就是对应Directory类中的addSubNode()和removeSubNode()函数)?

欢迎留言和我分享你的想法。如果有收获,也欢迎你把这篇文章分享给你的朋友。

# 精选评论

点击查看

八戒

课堂讨论
可以把计算文件数量和大小的逻辑抽出来,定义两个成员变量文件大小和文件数量;
在每次addSubNode()和removeSubNode()的时候去调用计算逻辑,更新文件大小和文件数量;
这样在调用countNumOfFiles和countSizeOfFiles的时候直接返回我们的成员变量就好了;
当然如果这么做的话,那countNumOfFiles和countSizeOfFiles这两个方法的名字也不合适了,应该叫numOfFiles和sizeOfFiles
1
2
3
4
5

下雨天

课堂讨论:
实质是&#34;递归代码要警惕重复计算&#34;问题!可以用散列表存储每个(path,size),通过路径直接返回对应的size,删除或者添加的时候,维护这个size即可。

参看争哥《数据结构与算法之美》第十讲:为了避免重复计算,我们可以通过一个数据结构(比如散列表)来保存已经求解过的 f(k)。当递归调用到 f(k) 时,先看下是否已经求解过了。如果是,则直接从散列表中取值返回,不需要重复计算,这样就能避免刚讲的问题了。
1
2
3
4

test

把计算逻辑放在addSubNode和removeSubNode里面
1

辣么大

我想的一个思路是:每个节点新增一个field:parent,父链接指向它的上层节点,同时增加字段numOfFiles,sizeOfFiles。对于File节点:numOfFiles=1, sizeOfFiles=它自己的大小。对于Directory节点,是其子节点的和。删除、增加subnode时,只需要从下向上遍历一个节点的parent link,修改numOfFiles和sizeOfFiles。这样的话删除、新增subnode修改值的复杂度为树的深度,查询返回numOfFiles和sizeOfFiles复杂度为O(1)。
1

南山

真的是没有最适合,只有更适合
实际工作中碰到过一个场景需要抽象出条件和表达式来解决的。一个表达式可以拥有N个子表达式以及条件,这个表达式还有一个属性and、or来决定所有子表达式/条件是全部成立还是只要有一个成立,这个表达式就成立。
当时做的时候真是各种绕,这种场景真的非常适合组合模式,能大大简化代码的实现难度,提高可读、可维护性
1
2
3

相逢是缘

一、定义(理解):
将一组对象组织(Compose)成树形结构,以表示一种“部分 - 整体”的层次结构。组合让客户端(在很多设计模式书籍中,“客户端”代指代码的使用者。)可以统一单个对象和组合对象的处理逻辑。
 对业务场景的一种数据结构和算法的抽象。其中,数据可以表示成树这种数据结构,业务需求可以通过在树上的递归遍历算法来实现。
二、使用场景:
业务场景必须能够表示成树形结构。
三、实现方式:
  组合模式,将一组对象组织成树形结构,将单个对象和组合对象都看做树中的节点,以统一处理逻辑,并且它利用树形结构的特点,递归地处理每个子树,依次简化代码实现。(在这里一般可以抽象出一个抽象类,叶子节点和中间节点(根节点)继承与抽象类,对中间节点(根节点)处理就是递归的调用)
1
2
3
4
5
6
7

webmin

//每一级目录保存本级目录中的文件数和文件Size,Count时递归统计所有子目录
public class Directory extends FileSystemNode {
    private List&lt;FileSystemNode&gt; subNodes = new ArrayList&lt;&gt;();
    private Map&lt;String,FileSystemNode&gt; subDirectory = new HashMap&lt;&gt;();
    private int _numOfFiles = 0;
    private long _sizeofFiles = 0;

    public Directory(String path) {
        super(path);
    }

    @Override
    public int countNumOfFiles() {
        int numOfFiles = 0;
        for (FileSystemNode fileOrDir : subDirectory.values()) {
            numOfFiles += fileOrDir.countNumOfFiles();
        }
        return numOfFiles + _numOfFiles;
    }

    @Override
    public long countSizeOfFiles() {
        long sizeofFiles = 0;
        for (FileSystemNode fileOrDir : subDirectory.values()) {
            sizeofFiles += fileOrDir.countSizeOfFiles();
        }
        return sizeofFiles + _sizeofFiles;
    }

    public void addSubNode(FileSystemNode fileOrDir) {
        if(fileOrDir instanceof Directory) {
            subDirectory.put(fileOrDir.getPath(),fileOrDir);
        } else {
            _numOfFiles++;
            _sizeofFiles += fileOrDir.countSizeOfFiles();
            subNodes.add(fileOrDir);
        }
    }

    public void removeSubNode(FileSystemNode fileOrDir) {
        if(fileOrDir instanceof Directory) {
            subDirectory.remove(fileOrDir.getPath());
            return;
        }
        int size = subNodes.size();
        int i = 0;
        for (; i &lt; size; ++i) {
            if (subNodes.get(i).getPath().equalsIgnoreCase(fileOrDir.getPath())) {
                break;
            }
        }
        if (i &lt; size) {
            subNodes.remove(i);
            _numOfFiles--;
            _sizeofFiles -= fileOrDir.countSizeOfFiles();
        }
    }
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58

小晏子

Directory中缓存子节点数量和大小的信息,每次addSubNode和removeSubNode时,失效缓存的节点数量和大小的信息,这样每次查询的时候,如果缓存的信息有效,那么就直接返回,反之就遍历一遍,有点类似于数据库和cache数据同步的cache-aside方式,另外如果file本身大小如果有变化,也要有办法去失效Directory中的缓存信息,这就需要实现新的接口通知机制。
1

小兵


悠游

将countNumOfFiles() 和 countSizeOfFiles()的结果保存为临时变量,初始化的时候生成,待后期add和delete的时候,进行修改(会涉及到整条路径),以后获取结果的时候直接从临时变量中获取

使用方式适合写多读少的场景。
1
2
3

javaadu


Frank

打卡 今日学习组合模式,收获如下:
1. 对该模式有一个基本的认识
2. 该模式在开发中使用的场景并不多。可以使用该模式的业务场景需要满足业务域能够形成树形结构
3. 该模式是运用面向对象的思想来处理符合树形结构的业务场景,使得用户处理业务需求转化到处理整颗树或者数的一部分。
1
2
3
4

唐朝农民

那个算薪资的在实际生产中也不回这么用吧,虽然使用设计模式提高代码的可扩展性,但是需要循环,递归调用数据仓储层,如果员工一多肯定造成很大的性能影响,这也是我经常纠结的地方,有个时候为了减少访问数据库的次数,而不得不放弃更优雅的代码,请问这种情况该怎么破?
1

Wh1


Algo


陆老师

可以加入fileSize,和fileCount字段,并用volatile修饰。文件的增删改操作,重新计算并赋值两个成员变量。其他线程读取到的数值也是最新的数值。
1

,

课后题:
这种方案应该多用于在服务启动时,从数据库/配置文件取出数据,按照格式缓存起来,外部调用的时候直接从缓存中去取,可以添加变量size,维护在各个节点下面,在add/remove时同时更新缓存和数据库(ps:这种数据一般很少变化吧?)
1
2

Jackey

目录结构中存储这两项数据是否可行?每次新增或删除文件时就更新父节点的数据。这样的话就需要在结构体中增加一个“父指针”。
1

守拙


#极客时间
上次更新: 2025/06/04, 15:06:15
门面模式:如何设计合理的接口粒度以兼顾接口的易用性和通用性?
享元模式(上):如何利用享元模式优化文本编辑器的内存占用?

← 门面模式:如何设计合理的接口粒度以兼顾接口的易用性和通用性? 享元模式(上):如何利用享元模式优化文本编辑器的内存占用?→

最近更新
01
AIIDE
03-07
02
githubActionCICD实战
03-07
03
windows安装Deep-Live-Cam教程
08-11
更多文章>
Theme by Vdoing
总访问量 次 | 总访客数 人
| Copyright © 2021-2025 ggball | 赣ICP备2021008769号-1
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式
×

评论

  • 评论 ssss
  • 回复
  • 评论 ssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss
  • 回复
  • 评论 ssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss
  • 回复
×