黄宽的blog

宁可十年不将军,不可一日不拱卒



浅谈php变量的实现

1.php是如何运行的

php作为一个脚本语言,但不是靠解释器来解释语言。php代码首先经过zend编译器,将php代码编译成opcode,再由虚拟的一个zend虚拟机来执行这段opcode,这种运行模式与java有些类似,java是先编译成 .class文件再由虚拟机来执行,java本身这个语言不是跨平台的,而是这个虚拟机是跨平台的,java程序运行完毕后,class文件会保存下来,下次运行直接执行,与php不同,php转成的opcode当程序运行结束后opcode会被清除不会被保留,下次再运行会再次生成opcode。

2.php是c语言实现的,而c语言是强类型语言,php是弱类型语言,这是如何实现的zend.h

php无需声明一个变量的类型,就可以赋值,底层是如何描述这个变量的呢,php的变量在底层是以一个基本的结构体描述一个变量的。

这个是php变量在内存中的存储结构(在php源码Zend/zend.h里)

struct _zval_struct {
    /* Variable information */
    zvalue_value value;     /* value */->这个是一个联合体,存储着这个变量的值和其他信息
    zend_uint refcount__gc;->这里最好理解成这个结构体一共有几个变量在使用
    zend_uchar type;    /* active type */->这里存储这个值的变量的基础类型(一共八种)
    zend_uchar is_ref__gc;->这里表示这个变量是否为引用的值的(0为否,1为是)
};

这个就是上面所说的联合体

typedef union _zvalue_value {
    long lval;                  /* long value */
    double dval;                /* double value */
    struct {
        char *val;
        int len;
    } str;->一个字符串类型,里面包含了一个字符串长度
     HashTable *ht;              /* hash table value */->这带包一个哈希表指针
    zend_object_value obj;->这代表对象
} zvalue_value;

如果仔细观察会发现这个联合只有五种数据结构,并没有php的八种数据结构(结构体里也是八种),和php的八种数据结构差了三个,null,bool,resource。

可以确定的是所有变量都是由这个结构体来实现的,null在底层可以没有这个类型,在结构体里的type直接设置为IS_NULL,zvalue_value就可以不必设置了,布尔类型的在type里为is_bool,在联合体中直接设置为0/1就可以了,资源类型在type里设置为资源,然后在value里的表示为一个接口的编号。

那$a=1;这一个动作发生了什么呢,执行到这一句,在内存中会多出一个结构体和一个联合体,在全局符号表(也就是哈希表)中会多出一条记录,记录这个变量的名字a,和这个变量的值的内存地址,也就是那个结构体的内存地址。

那$b=$a;这一传值赋值发生了什么。执行到这一句,并没有再多出一个结构体,只是全局符号表里再多出一条记录也是指向$a这个结构体的,这个结构体的refcount__gc变为2,表示有两个变量名指向了这个结构体。如果随便再给$a或者$b赋一个其他的值,结构体会分裂成两个,比如说$a=2;首先会看这个结构体的is_ref__gc是否等于0,如果是,则这个时候会多出一个结构体,哈希表里的$a的地址也会指向值为2的结构体。这种特性叫做写时复制(简写为cow,copy on write),很多种语言都有这种特性,就是为了省内存。如果不是传值赋值而是引用赋值的话,is_ref_gc等于1,公用一个结构体。

鸟哥的博客里有更深入的解释

 

  php

作者  :  黄宽

不耻最后,即使慢,驰而不息,纵会落后,纵令失败



About ME

about me

黄宽

我不想成为一个庸俗的人。十年百年后,当我们死去,质疑我们的人同样死去,后人看到的是裹足不前、原地打转的你,还是一直奔跑、走到远方的我?

友情链接