PHP静态分析与跨站脚本检测(三)

php中文网

发布时间：2016-06-08 17:32:09

1475人浏览过

来源于php中文网

原创

以下是我看Pixy中一些程序的记录，主要是为了之后能够比较快速的理解程序的思路，记录下来，要不然那么多东西光靠脑子怎么行。有的地方可能有所纰漏，我自己看着可能都觉得不太好。

ProgramConverter

- convert()
    首先利用phpparser建立一棵parsetree，但是这棵tree只在这里使用而已。利用这棵tree、输入文件以及programconverter对象本身建立tacconverter对象basetac，然后调用basetac.convert()。这个basetac即是可以通过本对象返回的tacconverter属性。然后通过basetac.getincludenodes()获得需要处理的被包含文件。
    进入while循环，前提是函数内局部变量goon为true和没有“-w”参数。该while循环命名为（w1*），设置goon=false。如果需要处理的包含文件链表不为空，进入第二个while循环（w2*）。通过for循环将所有的cfgnodeinclude结点单独提取出来，如果这个node是需要跳过的（skip），就取下一个node；如果不是直接通过“常量”包含文件的话，就继续取下一个，这个展示不处理；如果以上两条都不满足，调用include()方法，返回一个内部枚举类型incstatus，重设将要处理链表，继续w2*。使用basetac处理一下之后，如果不存在non-literal includes就跳出w1*。否则，开始处理non-literal includes。（253：this.basetac.backpatch();）。使用basetac中得到的所有方法，包括用户方法和main方法计算（259 - 260）。建立aliasanalysis对象，并以之作为参数建立literalanalysis对象，调用analyze()开始分析。然后，获取包含结点设置为将要处理的包含文件链表，进入for循环，逐个检测，如果已经检测过，跳过，否则即为non-literal的包含文名，按条件分别处理。在通过this.include()方法的返回值决定for循环的去向。再通过this.basetac.assignfunctions()，然后重新设置需要处理的包含链表，继续w1*。
    将之前得到的可能会有用的包含文件列表中实际没有用的都去掉。并将literalanalysis置为null，以节省内存。如果需要使用aliasanalysis，作出相应处理（361 - 364行），否则，利用basetac调用replaceglobals()，将所有函数的局部变量使用相应的全局变量替换，进行type分析，与前边的literal过程分析差不多。然后将functions转换为cfgnode，然后输出统计信息。释放资源，调用basetac.addsuperglobalelements()添加全局元素，将节点倒序排列。
- include()
    得到应该包含的文件，如果文件不存在，返回notfound。否则，在allfiles中添加该文件，并将包含与被包含添加到includegraph中，如果添加成功，对被包含的文件建立parsetree，并建立tacconverter对象，但是这里的对象都只是用来检测里边的include，并将这些cfgnodeinclude添加进从convert()传过来的wecomeafterwards中，以待处理。这样将goon=true，循环检测。

CfgEdge

inEdges对于CfgNodeIf来说,是指判断条件,而outEdges是结果。对于其他的node有点说不清楚。

InterAnalysis

    从这个程序看，将被扫描文件分析之后，得到的主要是TacConverter，由他得到TacFunction，然后再得到CfgNode，一个CfgNode对应一个Context，二者共同组成InteWorkListElemnt。在InterAnalysisInfo中则是每一个Cfgode对应一个InterAnalysisNode，在这个node中，由先前与刚才CfgNode对应的Context对应一个LatticeElement，而Latticelement则分别存放相应的信息。如AliasLatticelement存放MustAliases和MayAliases，而DepLatticeElement则存放TacPlace、DepSet、Vatiable等。
    对于test.php来说，通过initTransferFunction()时，在ProgramConverter.convert()中产生了TransferFunctionId，而在checker.analyzeTaint()中则还得到了ConpositeTransferFunction。这时，每个InterAnalysisNode所包含的TransferFunction是确定了的实例，因而下边的transfer方法调用时会调用相应的实例的方法。对于本例，由于TransferFunctionId.transfer()返回的是传入的参数本身，故调用transfer之后得到的outValue与inValue是一样的。仅出现在当analyze()中node为后便三种的时候，第一种没有使用outValue，第二种直接使outValue = inValue。
- initGeneric()
    后边的interAnalysisInfo()怎么就有长度了，没搞清楚。通过initTransferFunction()好像能够将genericAnalysisInfo添加数据，试验中是23个。但是 interAnalysisInfo也是23个。因该是这样的，二者指向同一个内存地址，对genericAnalysisInfo添加内容，就使得interAnalysisInfo也有了同样的内容。
- analyze ()
    这个方法主要是针对不同的node采取不同的措施。主要分为了5类node
        - CfgNodeCall
        - CfgNodeExit
        - CfgNodeIf
        - CfgNodeCallRet
        - 其他
            通过inValue转换得到outValue，然后得到node的所有outgoing的边(outEdges)，将每条边的终点节点即node的继承者successor得到，然后通过当前的context和刚得到的outValue、successor共同增殖（propagete），向analysisNode设置新的 PhiValue，并向workList中添加InterWorkListElement。这里我理解propagate是产生一个InterWorkListElement，因为在analyze中使用的是它。
    在analyze()刚开始的时候,workList中只有一个元素InterWorkListElement(this.mainHead, this.mainContext)。
    analyze()中通过analysisNode获得的LatticeElement由test.php第一次在ProgramConverter.convert()中时都是TypeLatticeElement，而在Checker中analyzeTaint()时则全是DepLatticeElement。通过调用dump方法可知，前几个的结果即placeToDep为空，而后便则打印出整个Map。

- propagate(Context context, LatticeElement value, CfgNode target)
    在analyze()中多数情况下调用都是(当前context，outValue，successor)
    通过target得到InterAnalysisInfo中对应的analysisNode，不为null的话，通过context得到target的oldPhiValue，如果oldPhiValue=null，则将其设为所有LatticElementd的初始值，实际上也是null。如果value==oldPhiValue，则说明值没有改变，可以返回了。否则，在lattice中使用value和oldPhiValue计算一个newPhiValue，如果这个newPhiValue与oldPhiValue不同，则将其设置为target的Phivalue，并在workList中添加一个InterWorkListElement以便analyze()中继续分析。

DepClient

    - collectSinks()
        对于test0225.php而言，对XSS检测得到的functions数目为2，但是sinks数目为5；对SQL检测functions数目为2，sinks数目为1。
        首先通过depAnalysis实例得到所有的TacFunction，然后对于每个TacFunction获得Cfg之后对CfgNode排序然后逐个检测。
        得到的TacFunction有两个分别为：_main和foo，里边包含的CfgNode分别是21个和3个。而对于XSS检测有5个sink，均为echo，这里不管是否会产生XSS，均作为sink返回。

    - findDangerousUninit(DepGraph relevant)
        首先找出relevant中的uninit nodes，结果显示在上一个方法中XSS的5个sink中，后两个返回结果都为空。对于不为空的uninitNode，则是找出其父节点Predecessor，如果父结点不为1个，则抛出异常，否则取出这一个父结点，研究两种情况：
            - DepGraphOpNode    直接认定为evil function返回。
            - DepGraphNormalNode    调用initiallyTainted()方法查看返回值，如果为ALWAYS或者IFRG，则认为是evil function，返回。

    - initiallyTainted(TacPlace place)
        这里place考虑三种情况：
            - Constant（常量）这种情况下，直接就认为不可能是tainted，返回NEVER
            - Variable（变量）又分两种情况
                - superglobals 在某些特定情况下认为是harmless，其余都是可能有害的。详见DepClient.java
                - non-superglobals 同上。但是某些跟命令行“-g”选项有关。
                - others 都认为是有害的。

TacConverter

- start()
通过传入的PhpTree的root建立起两个CfgNode，作为Cfg的root和exit，然后将tree中的各个node连接起来，将phptree转换成Cfg。

Viggle AI

Viggle AI是一个AI驱动的3D动画生成平台，可以帮助用户创建可控角色的3D动画视频。

下载

立即学习“PHP免费学习笔记（深入）”；

至于上文中提到的test0225.php，文件如下：

php
function foo ()
{

        $var =  $_GET[''evil''];
        return $var;

}

//$a =  $_GET[''evil''];
$b = foo ();

//$a=5;
//echo $a;
echo $b;
// $a is 6 here
echo $_GET[''a''];

echo $e;

$x = explode(''_'', $get);
mysql_query($x[0]);

if (true)    echo "ABCD";

if ($a == ''a'' && $c == ''d'') echo "dfg";

?>

PHP速学教程(入门到精通)

PHP怎么学习？PHP怎么入门？PHP在哪学？PHP怎么学才快？不用担心，这里为大家提供了PHP速学教程(入门到精通)，有需要的小伙伴保存下载就能学习啦！

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Zend Framework入门指引下一篇：eclipse 快速建立PHP调试环境

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

Golang 测试体系与代码质量保障：工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链（如go test）、单元测试、集成测试及端到端测试实践，结合代码覆盖率分析、静态代码扫描（如go vet）和动态分析工具，建立全链路质量监控机制。通过自动化测试框架、持续集成（CI）流水线配置及代码审查规范，实现测试用例管理、缺陷追踪与质量门禁控制，确保代码健壮性与可维护性，为高可靠性工程系统提供质量保障。

2026.02.28

Golang 工程化架构设计：可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则，涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术，帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

2026.02.28

Golang 性能分析与运行时机制：构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面，深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略，并结合实际案例剖析 Go 程序的运行时行为，帮助开发者掌握构建高性能应用的关键技能。

2026.02.28