HL7消息须按MLLP协议用VT(\u000b)和FS(\u001c)界定完整消息块,再以\r分段;MSH-1字段动态定义全局分隔符,需先解析再构建映射;空字段与重复段须边界检查与集合存储;TCP粘包需缓存拼接,编码须依MSH-17或设备文档指定。

HL7消息边界怎么切?别直接Split('\n')
HL7文件不是普通文本,开头有\u000b(VT,ASCII 11),结尾有\u001c(FS,ASCII 28),中间段用\r(CR,ASCII 13)分隔——这是MLLP封装层的硬性约定。直接按\n切会漏掉VT/FS,导致首尾段解析失败或粘连。
- 正确做法:先用
IndexOf('\u000b')和LastIndexOf('\u001c')定位完整消息块,再用\r拆段 - 遇到多条消息连发(常见于TCP流),必须循环扫描VT→FS区间,不能依赖换行符
- 有些设备发的是纯文本HL7(无VT/FS),但多数HIS/RIS系统强制要求MLLP包装,务必确认对接文档
字段分隔符是动态的!MSH-1决定一切
MSH|^~\&|...里|^~\&这四个字符不是固定写死的,而是由MSH段第一个字段定义的全局分隔符。如果MSH-1是|^~\&,那所有段都按此规则;但若它是|#~\&,你就得把^换成#来拆组件——忽略这点,PID-5.2(患者姓氏的前缀)就永远取错。
- 必须先解析MSH段,提取
MSH[1](即MSH-1字段),再构建分隔符映射表 -
~表示重复字段(如多个过敏原),^表示组件(如姓名=姓^名^中间名),\用于转义(如John\T\Smith里的\T\代表制表符) - 实操建议:用
string.Split(new char[] { '|' }, StringSplitOptions.None)拆段,再对每个字段用动态分隔符二次拆解
空字段和重复段怎么安全取值?别用vals[5]硬索引
HL7允许跳过可选字段(如PID|||John||19800101中第2、3、5字段为空),也允许同一段重复出现(如多个OBX)。直接按数组下标取值,遇到空字段会越界,遇到重复段会只拿到第一个。
- 必须检查字段长度:
if (fields.Length > 5 && !string.IsNullOrEmpty(fields[4]))再取PID-5 - 重复段要用集合存:
List<string[]> obxSegments = new List<string[]>();,遍历时判断line.StartsWith("OBX|") - 推荐封装一个
GetField(string segment, int index)方法,内部做边界和空值防护
TCP粘包+编码乱码是高频崩溃点
HL7消息走TCP时,多条消息可能粘成一包(如\u000bMSH...1c\u000bMSH...1c),而医院设备常发UNICODE或GBK编码,但.NET默认用UTF-8读取就会出现乱码,后续Split全失效。
- 接收Socket数据后,先用
Encoding.GetEncoding("GB2312")或查MSH-17(字符集字段)确定编码,再转字符串 - 粘包处理:缓存未完成的消息(如只收到VT没收到FS),拼接下次接收的数据后再解析
- 调试时用
BitConverter.ToString(bytes)打印原始字节,比看字符串更可靠
HL7解析真正的复杂点不在语法,而在“每个医院、每台设备都可能悄悄改一个字段含义”——比如某检验仪把OBR-4当检验项目代码,另一家却塞进申请单号。协议文档不细读,光靠标准字段定义硬套,十次有八次数据对不上。










