均使用同步模式,默认参数配置。
可以看出同步模型默认参数配置情况下,C++Serving QPS和平均时延指标均优于TF-Serving。
client_num | model_name | qps(samples/s) | mean(ms) | model_name | qps(samples/s) | mean(ms) |
---|---|---|---|---|---|---|
10 | pd-serving | 111.336 | 89.787 | tf-serving | 84.632 | 118.13 |
30 | pd-serving | 165.928 | 180.761 | tf-serving | 106.572 | 281.473 |
50 | pd-serving | 207.244 | 241.211 | tf-serving | 80.002 | 624.959 |
70 | pd-serving | 214.769 | 325.894 | tf-serving | 105.17 | 665.561 |
100 | pd-serving | 235.405 | 424.759 | tf-serving | 93.664 | 1067.619 |
150 | pd-serving | 239.114 | 627.279 | tf-serving | 86.312 | 1737.848 |
均使用异步模式,最大batch=32,异步线程数=2。
可以看出异步模式情况下,两者性能接近,但当Client端并发数达到70的时候,TF-Serving服务直接超时,而C++Serving能够正常返回结果。
同时,对比同步和异步模式可以看出,异步模式在请求batch数较小时,通过合并batch能够有效提高QPS和平均处理时延。
client_num | model_name | qps(samples/s) | mean(ms) | model_name | qps(samples/s) | mean(ms) |
---|---|---|---|---|---|---|
10 | pd-serving | 130.631 | 76.502 | tf-serving | 172.64 | 57.916 |
30 | pd-serving | 201.062 | 149.168 | tf-serving | 241.669 | 124.128 |
50 | pd-serving | 286.01 | 174.764 | tf-serving | 278.744 | 179.367 |
70 | pd-serving | 313.58 | 223.187 | tf-serving | 298.241 | 234.7 |
100 | pd-serving | 323.369 | 309.208 | tf-serving | 0 | ∞ |
150 | pd-serving | 328.248 | 456.933 | tf-serving | 0 | ∞ |
Вы можете оставить комментарий после Вход в систему
Неприемлемый контент может быть отображен здесь и не будет показан на странице. Вы можете проверить и изменить его с помощью соответствующей функции редактирования.
Если вы подтверждаете, что содержание не содержит непристойной лексики/перенаправления на рекламу/насилия/вульгарной порнографии/нарушений/пиратства/ложного/незначительного или незаконного контента, связанного с национальными законами и предписаниями, вы можете нажать «Отправить» для подачи апелляции, и мы обработаем ее как можно скорее.
Опубликовать ( 0 )