Про скорость в #python
Делал задачу по перелопачиванию больших матриц (больше 2гб) за целевое время меньше секунды на среднем железе и мы попробовали несколько инструментов: у pandas был результат около минуты, numpy - 10 сек, numba + numpy - меньше секунды. Правда, чтобы добиться целевого результата пришлось переписать половину алгоритмов numpy.
И так везде, главное выбрать правильную библиотеку под задачу, например, популярный bs4 можно заменить на lxml (которая написана на си) и парсер будет работать почти в 10 раз быстрее.