日期:2014-05-16  浏览次数:20671 次

Linux内核中流量控制(6)
本文档的Copyleft归yfydz所有,使用GPL发布,可以自由拷贝,转载,转载时请保持文档的完整性,严禁用于任何商业用途。
msn: yfydz_no1@hotmail.com
来源:http://yfydz.cublog.cn

5.6 DSMARK(Differentiated Services field marker)
 
DSMARK算法实际不能算特别流控算法, 本身只是一个pfifo流控, 所做的多余功能就是能设置数据包的tos/ds域, 其实意义不大, 该功能在网络层就能作(netfilter/TOS目标)。使用时除了用tc qdisc命令设置外, 还要用tc class/filter命令对数据进行分类, 以设置合适的tos/ds值。

5.6.1 DSMARK操作结构定义

#define NO_DEFAULT_INDEX (1 << 16)
// DSMARK私有数据
struct dsmark_qdisc_data {
// 内部流控节点
 struct Qdisc  *q;
// 分类规则表, 通过tc class命令定义
 struct tcf_proto *filter_list;
// value/mask数组, 用于设置数据包IP头中的tos/ds域
 u8   *mask; /* "owns" the array */
 u8   *value;
// 索引
 u16   indices;
// 缺省索引
 u32   default_index; /* index range is 0...0xffff */
// 是否设置TC索引值标志
 int   set_tc_index;
};
 
// DSMARK流控操作结构
static struct Qdisc_ops dsmark_qdisc_ops = {
 .next  = NULL,
 .cl_ops  = &dsmark_class_ops,
 .id  = "dsmark",
 .priv_size = sizeof(struct dsmark_qdisc_data),
 .enqueue = dsmark_enqueue,
 .dequeue = dsmark_dequeue,
 .requeue = dsmark_requeue,
 .drop  = dsmark_drop,
 .init  = dsmark_init,
 .reset  = dsmark_reset,
 .destroy = dsmark_destroy,
// 没有change函数
 .change  = NULL,
 .dump  = dsmark_dump,
 .owner  = THIS_MODULE,
};
// DSMARK类别操作结构
static struct Qdisc_class_ops dsmark_class_ops = {
 .graft  = dsmark_graft,
 .leaf  = dsmark_leaf,
 .get  = dsmark_get,
 .put  = dsmark_put,
 .change  = dsmark_change,
 .delete  = dsmark_delete,
 .walk  = dsmark_walk,
 .tcf_chain = dsmark_find_tcf,
 .bind_tcf = dsmark_bind_filter,
 .unbind_tcf = dsmark_put,
 .dump  = dsmark_dump_class,
};

5.6.2 初始化

static int dsmark_init(struct Qdisc *sch, struct rtattr *opt)
{
// DSMARK私有数据
 struct dsmark_qdisc_data *p = PRIV(sch);
// 保存相关属性
 struct rtattr *tb[TCA_DSMARK_MAX];
 int err = -EINVAL;
 u32 default_index = NO_DEFAULT_INDEX;
 u16 indices;
 u8 *mask;
 DPRINTK("dsmark_init(sch %p,[qdisc %p],opt %p)\n", sch, p, opt);
// 选项参数解析, 至少要提供一个indices参数
 if (!opt || rtattr_parse_nested(tb, TCA_DSMARK_MAX, opt) < 0)
  goto errout;
// 获取indices值并检查是否合法, indices必须是2的整次幂
 indices = RTA_GET_U16(tb[TCA_DSMARK_INDICES-1]);
 if (!indices || !dsmark_valid_indices(indices))
  goto errout;
// 如果有缺省索引参数, 设置之
 if (tb[TCA_DSMARK_DEFAULT_INDEX-1])
  default_index = RTA_GET_U16(tb[TCA_DSMARK_DEFAULT_INDEX-1]);
// 分配value和mask空间, 都是indices大小
 mask = kmalloc(indices * 2, GFP_KERNEL);
 if (mask == NULL) {
  err = -ENOMEM;
  goto errout;
 }
// 前一半空间都初始化0xff作为mask
 p->mask = mask;
 memset(p->mask, 0xff, indices);
// 后一半空间都初始化0作为value
 p->value = p->mask + indices;
 memset(p->value, 0, indices);
// 设置DSMARK参数
 p->indices = indices;
 p->default_index = default_index;
 p->set_tc_index = RTA_GET_FLAG(tb[TCA_DSMARK_SET_TC_INDEX-1]);
// 内部流控节点是一个pfifo类型的qdisc
 p->q = qdisc_create_dflt(sch->dev, &pfifo_qdisc_ops);
 if (p->q == NULL)
  p->q = &noop_qdisc;
 DPRINTK("dsmark_init: qdisc %p\n", p->q);
 err = 0;
errout:
rtattr_failure:
 return err;
}
 

5.6.3 入队
 
// 入队操作主要是生成数据包的tc_index值
static int dsmark_enqueue(struct sk_buff *skb,struct Qdisc *sch)
{
 struct dsmark_qdisc_data *p = PRIV(sch);
 int err;
 D2PRINTK("dsmark_enqueue(skb %p,sch %p,[qdisc %p])\n", skb, sch, p);
// 如果有set_tc_index标志
 if (p->set_tc_index) {
  /* FIXME: Safe with non-linear skbs? --RR */
// 提取IPv4头的TOS字段或IPv4的ds字段作为数据包的tc_index
  switch (skb->protocol) {
   case __constant_htons(ETH_P_IP):
    skb->tc_index = ipv4_get_dsfield(skb->nh.iph)
     & ~INET_ECN_MASK;
    break;
   case __constant_htons(ETH_P_IPV6):
    skb->tc_index = ipv6_get_dsfield(skb->nh.ipv6h)
     & ~INET_ECN_MASK;
    break;
   default:
    skb->tc_index = 0;
    break;
  };
 }
// 如果该数据包是由此qdisc处理
 if (TC_H_MAJ(skb->priority) == sch->handle)
// 数据包的tc_index设置为skb->priority的低16位
  skb->tc_index = TC_H_MIN(skb->priority);
 else {
// 否则调用分类规则对数据包进行分类
  struct tcf_result res;
  int result = tc_classify(skb, p->filter_list, &res);
  D2PRINTK("