用 HashMap 存书名→作者实现 O(1) 查询,反向查作者→书单则用 computeIfAbsent 初始化列表;TreeSet 用于去重+字典序排序,需注意中文排序需自定义 Comparator;Stream API 替代 for 循环做筛选,注意判空和异常处理。

用 HashMap 存书名和作者,别用 ArrayList 暴力遍历
查一本书的作者,或按作者找所有书——这类操作频次高、要求快,ArrayList 逐个 equals() 对比会随数据量线性变慢。直接用 HashMap 存 "书名" → "作者",get() 是 O(1);若需反向查(作者→书单),就用 HashMap,插入时先 computeIfAbsent() 获取或初始化列表。
常见错误:把整本 Book 对象当 key 放进 HashMap,却没重写 hashCode() 和 equals(),导致 get() 总返回 null。
实操建议:
- 书名作为 key 时,统一用
trim().toLowerCase()预处理,避免“Java编程思想”和“ java编程思想 ”查不到 - 作者为多人(如“王珊, 萨师煊”)时,别拆成多个 key,保持原字符串,搜索时用
contains()或正则匹配 - 不追求事务或持久化时,静态
Map初始化一次即可,不用每次 new
用 TreeSet 实现按书名自动排序 + 去重
用户输入一批书名,要展示“已录入书单”且按字典序排列,同时过滤重复项——TreeSet 天然满足这两点,比先塞 ArrayList 再 Collections.sort() + 手动去重更简洁。
立即学习“Java免费学习笔记(深入)”;
注意:TreeSet 默认按自然序排序,中文按 Unicode 码点排(“人工智能”会在“算法导论”前,但“Python”会在“数据结构”后),若需真正按拼音排序,得传入自定义 Comparator,比如用 Collator.getInstance(Locale.CHINA)。
实操建议:
- 不要用
TreeSet却只靠Book.toString()排序,应明确指定排序字段(如book.getTitle()) - 如果后续还要查作者,
TreeSet本身不支持快速查找 value,得另配一个HashMap,二者同步更新 - 并发读写场景下,
TreeSet非线程安全,别直接包装成Collections.synchronizedSortedSet()就完事,迭代时仍可能抛ConcurrentModificationException
用 Stream API 做条件筛选,别手写 for 循环
比如“查所有作者含‘李’字的书”或“找标题长度大于 10 的计算机类图书”,这类逻辑用传统循环易出边界错、空指针、漏 break。Java 8+ 的 Stream 更声明式、可读性强,且底层做了短路优化(findFirst() 找到就停)。
示例:从 List 中筛选
books.stream()
.filter(book -> book.getAuthor() != null && book.getAuthor().contains("李"))
.filter(book -> "计算机".equals(book.getCategory()))
.map(Book::getTitle)
.collect(Collectors.toList());
常见坑:
-
stream()对空集合返回空流,但对null集合调用会直接NullPointerException,务必提前判空 -
filter()内部若调用可能抛异常的方法(如解析 ISBN),必须用 try-catch 包裹,否则整个流中断 - 小数据量(Stream 和循环性能差异可忽略,别为了“看起来高级”硬套
避免把集合当数据库用:什么时候该换 SQLite
当图书条目超过 500 条、需要模糊搜索(如“*算法*”)、支持多字段组合查(作者+年份+分类)、或要求重启后数据不丢——纯内存集合就撑不住了。这时候硬加索引、手写全文匹配,不如直接嵌入 SQLite(用 sqlite-jdbc 驱动)。
一个信号:你开始给 ArrayList 写 fullTextSearch() 方法,并在里面用 Pattern 编译正则——说明该移交数据库了。
轻量接入建议:
- 建表语句尽量简单:
CREATE TABLE books (id INTEGER PRIMARY KEY, title TEXT, author TEXT, year INTEGER) - 用
PreparedStatement防 SQL 注入,尤其书名含单引号时(如《罗密欧与朱丽叶》) - 首次启动自动建库建表,但别在每次运行都
DROP TABLE,否则数据全丢
集合类不是万能胶,它解决的是“内存中快速组织与遍历”,不是“持久化与复杂查询”。工具用对地方,代码才不会越写越沉。










