一次订单号重复的事故差点被开除
往期热门文章:
1、《往期精选优秀博文都在这里了!》
往期热门文章:
2、如何优雅的转换Bean对象? 3、手机没网了,却还能支付,这是什么原理? 4、使用IntelliJ IDEA查看类图,内容极度舒适 5、记一次订单号重复的事故,快看看你的 UUID 在并发下还正确吗?
去年年底的时候,我们线上出了一次事故,这个事故的表象是这样的:
系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照 订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以 这次系统升级一定要解决掉。
经手的同事之前也改过几次,不过效果始终不好:总会出现订单号重复的问题,
所以趁着这次问题我好好的理了一下我同事写的代码。
这里简要展示下当时的代码:
/**
* OD单号生成
* 订单号生成规则:OD + yyMMddHHmmssSSS + 5位数(商户ID3位+随机数2位) 22位
*/
publicstatic String getYYMMDDHHNumber(String merchId){
StringBuffer orderNo =
new StringBuffer(
new SimpleDateFormat(
"yyMMddHHmmssSSS").format(
new Date()));
if(StringUtils.isNotBlank(merchId)){
if(merchId.length()>
3){
orderNo.append(merchId.substring(
0,
3));
}
else {
orderNo.append(merchId);
}
}
int orderLength = orderNo.toString().length();
String randomNum = getRandomByLength(
20-orderLength);
orderNo.append(randomNum);
return orderNo.toString();
}
/** 生成指定位数的随机数 **/publicstatic String getRandomByLength(int size){
if(size>
8 || size<
1){
return"";
}
Random ne =
new Random();
StringBuffer endNumStr =
new StringBuffer(
"1");
StringBuffer staNumStr =
new StringBuffer(
"9");
for(
int i=
1;i<size;i++){
endNumStr.append(
"0");
staNumStr.append(
"0");
}
int randomNum = ne.nextInt(Integer.valueOf(staNumStr.toString()))+Integer.valueOf(endNumStr.toString());
return String.valueOf(randomNum);
}
可以看到,这段代码写的其实不怎么好,代码部分暂且不议,代码中使订单号不重复的主要因素点是随机数和毫秒,可是这里的随机数只有两位
在高并发环境下极容易出现重复问题,同时毫秒这一选择也不是很好,在多核CPU多线程下,一定时间内(极小的)这个毫秒可以说是固定不变的(测试验证过),所以这里我先以100个并发测试下这个订单号生成,关注微信订阅号码匠笔记,回复架构获取一些列的架构知识。测试代码如下:
{
final String merchId =
"12334";
List<String> orderNos = Collections.synchronizedList(
new ArrayList<String>());
IntStream.range(
0,
100).parallel().forEach(i->{
orderNos.add(getYYMMDDHHNumber(merchId));
});
List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());
System.out.println(
"生成订单数:"+orderNos.size());
System.out.println(
"过滤重复后订单数:"+filterOrderNos.size());
System.out.println(
"重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}
果然,测试的结果如下:
生成订单数:100
过滤重复后订单数:87
重复订单数:13
当时我就震惊🤯了,一百个并发里面竟然有13个重复的!!!,我赶紧让同事先不要发版,这活儿我接了!
对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的,我大概花了6+分钟和同事商量了下业务场景,决定做如下更改:
去掉商户ID的传入(按同事的说法,传入商户ID也是为了防止重复订单的,事实证明并没有叼用) 毫秒仅保留三位(缩减长度同时保证应用切换不存在重复的可能) 使用线程安全的计数器做数字递增(三位数最低保证并发800不重复,代码中我给了4位) 更换日期转换为java8的日期类以格式化(线程安全及代码简洁性考量)
经过以上思考后我的最终代码是:
AtomicInteger SEQ =
new AtomicInteger(
1000);
privatestaticfinal DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern(
"yyMMddHHmmssSS");
privatestatic ZoneId ZONE_ID = ZoneId.of(
"Asia/Shanghai");
publicstatic String generateOrderNo(){
LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);
if(SEQ.intValue()>
9990){
SEQ.getAndSet(
1000);
}
return dataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement();
}
当然代码写完成了可不能这么随随便便结束了,现在得走一个测试main函数看看:
{
List<String> orderNos = Collections.synchronizedList(
new ArrayList<String>());
IntStream.range(
0,
8000).parallel().forEach(i->{
orderNos.add(generateOrderNo());
});
List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());
System.out.println(
"生成订单数:"+orderNos.size());
System.out.println(
"过滤重复后订单数:"+filterOrderNos.size());
System.out.println(
"重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}
/**
测试结果:
生成订单数:8000
过滤重复后订单数:8000
重复订单数:0
**/
真好,一次就成功了,可以直接上线了。。。
然而,我回过头来看以上代码,虽然最大程度解决了并发单号重复的问题,不过对于我们的系统架构还是有一个潜在的隐患:如果当前应用有多个实例(集群)难道就没有重复的可能了?关注微信订阅号码匠笔记,回复架构获取一些列的架构知识。
鉴于此问题就必然需要一个有效的解决方案,所以这时我就思考:多个实例应用订单号如何区分开呢?以下为我思考的大致方向:
- 使用UUID(在第一次生成订单号时初始化一个)
- 使用redis记录一个增长ID
- 使用数据库表维护一个增长ID
- 应用所在的网络IP
- 应用所在的端口号
- 使用第三方算法(雪花算法等等)
- 使用进程ID(某种程度下是一个可行的方案)
在此我想了下,我们的应用是跑在docker里面,而且每个docker容器内的应用端口都一样,不过网路IP不会存在重复的问题,至于进程也有存在重复的可能,对于UUID的方式之前吃过亏,总之吧,redis或DB也算是一种比较好的方式,不过独立性较差。。。
同时还有一个因素也很重要,就是所有涉及到订单号生成的应用都是在同一台宿主机(linux实体服务器)上, 所以就目前的系统架构我选用了IP的方式。
一下是我的代码:
org.apache.commons.lang3.RandomUtils;
import java.net.InetAddress;
import java.time.LocalDateTime;
import java.time.ZoneId;
import java.time.format.DateTimeFormatter;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.Collectors;
import java.util.stream.IntStream;
publicclassOrderGen2Test{
/** 订单号生成 **/privatestatic ZoneId ZONE_ID = ZoneId.of(
"Asia/Shanghai");
privatestaticfinal AtomicInteger SEQ =
new AtomicInteger(
1000);
privatestaticfinal DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern(
"yyMMddHHmmssSS");
publicstatic String generateOrderNo(){
LocalDateTime dataTime = LocalDateTime.now(ZONE_ID);
if(SEQ.intValue()>
9990){
SEQ.getAndSet(
1000);
}
return dataTime.format(DF_FMT_PREFIX)+ getLocalIpSuffix()+SEQ.getAndIncrement();
}
privatevolatilestatic String IP_SUFFIX =
null;
privatestatic String getLocalIpSuffix(){
if(
null != IP_SUFFIX){
return IP_SUFFIX;
}
try {
synchronized (OrderGen2Test.class){
if(
null != IP_SUFFIX){
return IP_SUFFIX;
}
InetAddress addr = InetAddress.getLocalHost();
// 172.17.0.4 172.17.0.199 , String hostAddress = addr.getHostAddress();
if (
null != hostAddress && hostAddress.length() >
4) {
String ipSuffix = hostAddress.trim().split(
"\\.")[
3];
if (ipSuffix.length() ==
2) {
IP_SUFFIX = ipSuffix;
return IP_SUFFIX;
}
ipSuffix =
"0" + ipSuffix;
IP_SUFFIX = ipSuffix.substring(ipSuffix.length() -
2);
return IP_SUFFIX;
}
IP_SUFFIX = RandomUtils.nextInt(
10,
20) +
"";
return IP_SUFFIX;
}
}
catch (Exception e){
System.out.println(
"获取IP失败:"+e.getMessage());
IP_SUFFIX = RandomUtils.nextInt(
10,
20)+
"";
return IP_SUFFIX;
}
}
publicstaticvoidmain(String[] args){
List<String> orderNos = Collections.synchronizedList(
new ArrayList<String>());
IntStream.range(
0,
8000).parallel().forEach(i->{
orderNos.add(generateOrderNo());
});
List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList());
System.out.println(
"订单样例:"+ orderNos.get(
22));
System.out.println(
"生成订单数:"+orderNos.size());
System.out.println(
"过滤重复后订单数:"+filterOrderNos.size());
System.out.println(
"重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}
}
/**
订单样例:20082115575546011022
生成订单数:8000
过滤重复后订单数:8000
重复订单数:0
**/
最后
代码说明及几点建议
generateOrderNo()方法内不需要加锁,因为AtomicInteger内使用的是CAS自旋转锁(保证可见性的同时也保证原子性,具体的请自行了解) getLocalIpSuffix()方法内不需要对不为null的逻辑加同步锁(双向校验锁,整体是一种安全的单例模式) 本人实现的方式并不是解决问题的唯一方式,具体解决问题需要视当前系统架构具体而论 任何测试都是必要的,我同事在前几次尝试解决这个问题后都没有自测,不测试有损开发专业性!
最新评论
推荐文章
作者最新文章
你可能感兴趣的文章
Copyright Disclaimer: The copyright of contents (including texts, images, videos and audios) posted above belong to the User who shared or the third-party website which the User shared from. If you found your copyright have been infringed, please send a DMCA takedown notice to [email protected]. For more detail of the source, please click on the button "Read Original Post" below. For other communications, please send to [email protected].
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。
版权声明:以上内容为用户推荐收藏至CareerEngine平台,其内容(含文字、图片、视频、音频等)及知识版权均属用户或用户转发自的第三方网站,如涉嫌侵权,请通知[email protected]进行信息删除。如需查看信息来源,请点击“查看原文”。如需洽谈其它事宜,请联系[email protected]。