有一关于读取word文档设计思路,大家帮忙分析下
现有这样的需求:
word文档内容包含有这样的数据:“商品名 数量 价格”。但排列格式不定。
或许是这样:
商品名 数量 价格
商品1 2 10元
商品2 3 34元
又或许是这样的排列:
商品名:商品1 数量:2件 价格: 10元
商品名:商品2 数量:3件 价格: 34元
如何通过java程序读取并解析将内部数据存入数据库中(字段:商品名,数量,价格)。
令人头痛的一点是,该数据由用户提供。内容格式完全不定。但内容范围大概确定就是商品信息数据了。请问大家以这样的数据来说。能不能读取并解析内容呢。
------解决方案--------------------
那如果说表头能确定页面,可以根据他解析,如果乱七八糟的乱写,那你对数据的分析能力再强也对不上号
------解决方案--------------------
如果能确实只有这两种格式,那就就写两个方法好了,一般的处理方法是让客户确定格式,不然你无法处理,不存在万能算法。