Как я прочитал этот ответ, можно выполнить сложение двух пар 4-битных целых чисел, хранящихся в 8-битных целых числах, с помощью всего лишь одного сложения и некоторых побитовых операций. Кроме того, автор этого ответа утверждает, что этот метод должно быть легко немного обобщить. Таким образом, я пытаюсь обобщить этот метод до сложения двух векторов, каждый из которых состоит из четырех 8-битных целых чисел, хранящихся в 32-битных целых числах.
Код: Выделить всё
uint32_t a, b;
uint32_t c = a + b;
uint32_t r = a ^ b ^ c; // calculate all carry
uint32_t s = r & (0x01010100); // carry of only the digits that we care
uint32_t sum = c - s; // undo the carry on these digits
Этот код работает для большинства входных данных, но я обнаружил исключения, когда пытался добавить целые числа, которые в основном дополняют отрицательные числа, близкие к 0. Например, если я установил
Код: Выделить всё
a = 0xfffeff00 // (-1,-2,-1, 0)
b = 0x01010100 // ( 1, 1, 1, 0)
ожидаемый результат — 0x00ff0000. Он работает
Код: Выделить всё
c = 0x01000000 // ( 1, 0, 0, 0)
r = 0xfffffe00 // (-1,-1,-2, 0)
s = 0x01010000 // ( 1, 1, 0, 0)
sum=0xffff0000 // (-1,-1, 0, 0)
Первые две цифры суммы становятся ff (что означает -1), но правильное число должно быть 0. Это связано с тем, что при вычитании c = 01 00 00 00 с s = 01 01 00 00 вычитание второй группы выходит за пределы и влияет на результат первой группы.
Я хочу улучшить последний шаг, чтобы избавиться от этой проблемы, но не могу найти хорошее решение.
Подробнее здесь:
https://stackoverflow.com/questions/794 ... e-addition