Пакет libblas-dev
, кажется, имеет необычную производительность (намного быстрее) в некоторых случаях в следующем вопросе.
https://stackoverflow.com/questions/38042451/cblas-gemm-time-dependent-on-input-matrix-values
Подобного улучшения производительности не наблюдается в других пакетах BLAS на других платформах.
Кто-нибудь может помочь объяснить это? Не стесняйтесь вносить изменения в вопрос / теги.